累積超過死亡と累積ワクチン接種率が高い相関を示している報告を吟味してみた

2022年序盤は超過死亡が多かった。すなわち、予想より沢山の方が亡くなったということだ。この原因は何か。あるメディアが、超過死亡のデータと、累積ワクチン接種率が高い相関を示すため、ワクチン接種が原因の可能性があると指摘した。これについて、元データや解析の手法について疫学の目線で吟味してみた。
12
もりふじ @疫学トーク @morifuji_eki

記事では、累積超過死亡と累積ワクチン接種率には相関がみられたため、因果の可能性も考える必要がある、と書かれていました。タイトルだけでなく、記事やデータ、そのソース、データの取得方法などを見るようにします。 twitter.com/agora_japan/st…

2022-10-09 18:50:11
アゴラ @agora_japan

国立感染症研究所の発表を受けて、データを更新しました。 【更新】超過死亡数の異常な増加の原因はワクチン追加接種か agora-web.jp/archives/22100…

2022-10-09 12:55:13
もりふじ @疫学トーク @morifuji_eki

データの出所を確認します。 nordot.app/95142909637782… このニュースにより記事を更新したとありました。 このニュースは感染研のデータなので感染研のWebサイトに行くと、定期的に更新のあるデータダッシュボードにたどり着きます。 exdeaths-japan.org

2022-10-09 18:59:24
もりふじ @疫学トーク @morifuji_eki

exdeaths-japan.org 感染研の運営しているこちらのダッシュボードには、データの集め方や指標の定義も詳しく書かれていました。 決して難しくないので今から一緒に読んでみましょう。

2022-10-09 19:02:44
もりふじ @疫学トーク @morifuji_eki

超過および過少死亡数は、「過去のデータをもとに統計モデルから予測された死亡数」と「実際に観測された死亡数」の差として算出されています。詳しい方法は下記の論文にあります。 wwwnc.cdc.gov/eid/article/27… ここで深さ優先探索をしてしまうのがもりふじ。つまりこの論文を読もうという話。すまん。

2022-10-09 19:08:06
もりふじ @疫学トーク @morifuji_eki

てことで今夜はこちらの連続ツイートをお待ちを。 今からご飯食べてきます。

2022-10-09 19:10:15
もりふじ @疫学トーク @morifuji_eki

論文ざっくり目を通しましたが、ポイントは2つです。 1. データは各自治体から取得され集計された人口動態統計のデータを用いている 2. 超過死亡の算出はよく知られた手法を用いている 1は、人口動態統計のクセを知っておくとよいと思いますが、 2については、ここでは深追いしなくていいでしょう。

2022-10-09 21:12:00
もりふじ @疫学トーク @morifuji_eki

さて、ここまでは超過死亡データがいかに取得され算出されたかを確認しました。 次いで累積ワクチン接種率のデータをみます。元記事ではデータの出典は明示されていませんでしたが、検索すると首相官邸が接種実績データを日別で公表しているようでした。 kantei.go.jp/jp/headline/ka…

2022-10-09 21:20:59
もりふじ @疫学トーク @morifuji_eki

このデータもどのように取得されたのか一応確認しましょう。 これには内閣官房が主導して構築されたVRS(ワクチン接種記録システム)を用いているようです。 このシステムへのデータの登録は市区町村が行いますが、各自治体のデータ収集方法は様々だそうです。 cio.go.jp/sites/default/…

2022-10-09 21:28:44
もりふじ @疫学トーク @morifuji_eki

ワクチン接種率に関しても比較的コンセンサスが得られたデータといってよいと思いました。 さて、ここまでのツイートで、元記事で言われている「累計超過死亡と累計ワクチン接種率は相関している」のデータの由来を確かめました。 次いで、その相関がどのように算出されたのか見てみましょう。

2022-10-09 21:35:41
もりふじ @疫学トーク @morifuji_eki

まず、この元記事の手法は「時系列研究(time trend analysis)」と呼ばれます。 個人ではなく集団を単位として、 要因(ワクチン接種率)の時間的な変化と、 結果(超過死亡)の時間的な変化との相関関係を調べるというものです。

2022-10-09 21:42:50
もりふじ @疫学トーク @morifuji_eki

公開データに個人情報は含まれていませんから、2つの公開データを合わせても個人を突合することはできません。 つまりこの例でいうと、 「死亡した特定の個人が、ワクチンを接種していたか」 という個人レベルで同時に要因と結果を持っていたかは不明です。

2022-10-09 21:45:48
もりふじ @疫学トーク @morifuji_eki

2つの公開データを用いた時系列研究は、このような「個人レベルではない」という限界はあるものの、記述統計データから早期に仮説を発見するのには役立ちます。 ではここで、相関係数0.99、という(驚くべき)数字についてはどのように考えたら良いのでしょうか。

2022-10-09 21:50:24
もりふじ @疫学トーク @morifuji_eki

時系列研究における相関係数は、2つのデータ系列を時間ごと(この場合は日ごと)に揃えて1組のデータとして、あとはピアソンの相関係数の計算をする、というものが一般的です(たぶん)。 これが0.99という非常に高いものだったということでした。

2022-10-09 21:55:39
もりふじ @疫学トーク @morifuji_eki

さて、「累計追加ワクチン接種率」と「累計超過死亡」の時系列研究における相関係数0.99について僕の目線をかきます。 両方とも「累計」であることが気になりました。 累計データとは常に右肩上がりのデータになるので、2つのトレンドは常に等しくなりますので、相関係数は大きくなりやすそうです。

2022-10-09 22:01:56
もりふじ @疫学トーク @morifuji_eki

と思いましたが累積超過死亡は、過少死亡のときに減少するので右肩上がりになるわけではないですね。 なので、例えばですが、累積超過死亡が増えている期間に限定して分析すれば、累積ワクチン接種率は常に右肩上がりなので、2つの相関は大きく見える、ということは言えそうです。

2022-10-09 22:29:51
もりふじ @疫学トーク @morifuji_eki

これは感染研の超過死亡ダッシュボードで、週ごとの死亡数を表示してみたものです。 ここ1年はほとんどの週で予測死亡数より観測死亡数が多いです。 このような状況ですと、累積のいかなるデータとも相関を持ちそうではあります。 pic.twitter.com/OIq8JtFD75

2022-10-09 22:35:30
拡大
もりふじ @疫学トーク @morifuji_eki

この指摘は、因果関係で取り除くべき3つの「ボス」のいずれに当たるのか。 偶然、バイアス、交絡。 広い意味では交絡、なのかも? 交絡因子は、時間。 両方とも時間とともに増えるデータだった、という話か。 続きます!

2022-10-09 22:41:31
もりふじ @疫学トーク @morifuji_eki

ちなみに私は、この元記事の報告について否定しているものでは全くありません! 累積データ同士の相関には交絡の可能性も考える必要があるよね、と言っています。 全ての健康関連の言説は完璧な正しさを持つのではなく、常に他の可能性も吟味しなければならないということです。

2022-10-09 22:44:47
もりふじ @疫学トーク @morifuji_eki

私が防ぎたいinfodemicというものは、健康関連の言説を見てすぐに 「ほらな」と言ったり「デマだ」と言ったりする行為から発生すると考えています。 今回の連続ツイートを参考に、どうぞ元データや解析方法について吟味されてください。 その方法がわからない? #ゆる疫学ラジオ へどうぞ!

2022-10-09 22:47:36