名古屋市の子宮頸癌ワクチンアンケート調査データの解析に挑む
- parasite2006
- 70729
- 664
- 38
- 136
@tonkyo_Vc すみません、こちらの2枚の図のタイトルを見ると左側が年齢16歳以下、右側が17歳以上と読めるのですが。twitter.com/tonkyo_Vc/stat… 年齢分布を見ると16歳以下は勧奨中止の影響で接種者が激減しており、信頼区間の幅がめちゃ広いのもその反映では?
2016-07-07 10:58:25確かにこれで見ると接種が勧奨されていた時に受けた群ではこれらの症状が増加している「様にも」見える。 pic.twitter.com/WzyXV4444F
2016-07-03 22:39:01@parasite2006 返事が遅くなってすみません。信頼区間が広くなっているのは一つはご指摘の通り16歳以下の人数が減っていることと、もう一つは症状17~24は発生者の絶対数が少ない、ということの両方の反映と考えられます。 city.nagoya.jp/kenkofukushi/c…
2016-07-07 23:43:22@tonkyo_Vc いえ、私が引用した元ツイートの説明には「確かにこれで見ると接種が勧奨されていた時に受けた群ではこれらの症状が増加している「様にも」見える。」とありますが、実際の図は左が年齢16歳以下(接種勧奨中止後に接種を受けた)ですからこの説明は違うのでは?という意味です
2016-07-07 23:54:47@parasite2006 すみません、完全に勘違いしていました。仰る通りですね、「接種勧奨勧奨が中止された以降に受けた群で増加の可能性あり」でした。
2016-07-08 00:06:17@tonkyo_Vc ご確認有難うございます。まとめを作った後で図を拡大して上のタイトルをよく見てみたら、思ったのと左右が逆だったのでびっくりしてお伺いさせていただいた次第です。速報結果web.archive.org/web/2015122319… 表3で実数値を見れば症状17~24は確かに低い
2016-07-08 00:21:28(本流に戻ります)
ただ、気を付けなければいけないのは、このように層別化した場合に、層別でのサンプルサイズが違う、ということ。これは信頼区間の幅に影響するので、これを同列に見るのは統計的に妥当とは言えない。サイズの違うデータのp値を比較することがナンセンスなのと同じこと。
2016-07-03 22:39:25それに、接種が勧奨されていることによる偏りとして接種しないのは特段の健康的事情がある人に限られていたという仮定と同時に、逆に接種勧奨が中止された後だって、今度は接種した群がその後の健康異常に注意深くなってより「症状あり」としやすくなるという可能性も排除できない。
2016-07-03 22:39:48年齢を共変量としても、層別化してもサンプルサイズの偏りは解消できないので、こういう場合は条件付きロジスティック回帰を行うのが方法としては最も妥当と思われる(勿論、層別化条件によってデータに変な偏りがない、という前提ではあるけど)。
2016-07-03 22:40:11結果はこんな感じ。年齢を共変量としたときの結果と大体同じ、という感じ。なお、本当は正確確率を求めるアルゴリズムでやるべきなのだけど、それやると天国的時間の長さになるので、Efronの近似アルゴリズムを採用。 pic.twitter.com/pPly4SZOTT
2016-07-03 22:40:33まあ、いずれにしてもこういう解析を行うこともできる、という例であって、これを以て何か確定的な結論を導こうとか、そういうものではない。それに、データの解析のプライオリティはあくまで名古屋市、名古屋市大にある。 (この話、ここまで)
2016-07-03 22:41:05CSV化結果の微妙な違い
昨夜 @tonkyo_Vc さんが↓に始まる19ツイートで名古屋市HPVVデータの解析をしてくださった。しかしfread()で列がずれるのはなぜだろう? twitter.com/tonkyo_Vc/stat…
2016-07-04 07:58:40名古屋のHPVVの調査結果のデータ、奥村@h_okumura 先生が作成したcsvファイルを用いてざっと解析を行った。ここに記載されている2つのファイルで結果を比較することからやろうとしたが、 oku.edu.mie-u.ac.jp/~okumura/stat/… のっけからドツボにはまった。
2016-07-03 22:30:03試したがfreadもreadrもずれない RT @h_okumura: 昨夜 @tonkyo_Vc さんが↓に始まる19ツイートで名古屋市HPVVデータの解析をしてくださった。しかしfread()で列がずれるのはなぜだろう? twitter.com/tonkyo_Vc/stat…
2016-07-04 08:54:13名古屋市HPVVデータ,私の作ったCSVといただいたCSVで,ごく一部が微妙に違うようだ。解析に使った部分は全部一致していたので気付かなかった
2016-07-04 12:32:40授業の合間に相違点1箇所だけ元PDFと照合したが私のほうが正しいみたいだった RT @h_okumura: 名古屋市HPVVデータ,私の作ったCSVといただいたCSVで,ごく一部が微妙に違うようだ。解析に使った部分は全部一致していたので気付かなかった
2016-07-04 15:20:08@h_okumura どこがどう違うと,はっきり言った方が良いと思いますが。奥村先生のデータを基準にすれば良いのでは?
2016-07-04 22:05:29違う箇所は簡単にRで調べられますが全部PDFと照合したわけではないので自信ないです。第3のCSVが現れればいいのですが RT @anonymous124816: @h_okumura どこがどう違うと,はっきり言った方が良いと思いますが。奥村先生のデータを基準にすれば良いのでは?
2016-07-04 22:17:29Raw dataとのトレーサビリティが取れないデータはどうしても信頼性の観点からは問題がありますし(これは名古屋市のデータの公表の仕方がいかんわけですが)、結果が違うファイルが増えると「どれが正しいのか」がわからなくなります。 twitter.com/h_okumura/stat…
2016-07-04 22:55:57@tonkyo_Vc 二種のpostscriptを眺めた限りでは数字セルは素直に順番通りな配置になっているので、多分pdf2txtの奥村先生版で大丈夫ではないかと。
2016-07-04 23:15:19(名古屋市のPDFデータから作った2通りのCSVファイルの比較とその方法)
名古屋市のHPVVデータの2バージョンの相違点を追記した oku.edu.mie-u.ac.jp/~okumura/stat/…
2016-07-05 13:55:58薬害オンブズパーソン会議の速報版解析結果に対する意見書をめぐって
追加/現在様々な人たちが名古屋市のデータを解析しています。しかしこのワクチンに反対している団体から今現在解析についてコメントがないのが残念です(こっそり解析中?)。/HPVワクチンのお話4:名古屋市へのコメントなどkarugamo-cl.jp/index.php?go=U…
2016-07-06 05:40:32