カーディス論文の信頼区間と発症予想ラインについて

濱岡先生の説明より 話題にしているカーディスの論文↓ http://jnci.oxfordjournals.org/content/97/10/724.full.pdf 途中の会話が?という方は、後半の???見出し以降を先にお読みください。
22
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka

@MAKIRIN1230 @leaf_parsley @sushikubo Chongsuvivatwongのp180およびBerslow Vol I. ch.5-6にあるように(発症したかしないかの0/1を説明するので)ロジット回帰。

2012-05-15 18:27:26
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka

@MAKIRIN1230 @leaf_parsley @sushikubo 個人別に推定されている線量をそのまま用いれば細かい差も検出できるはず。モデルのあてはまりのよさを比較しない、相関の高い線量の1次、2次項を入れるなど、被爆者データの分析と共通する問題点はある。

2012-05-15 18:27:48
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka

@MAKIRIN1230 @leaf_parsley @sushikubo しかし、Fig2をみる限り、閾値があるようにはみえず、1Gy以下では直線でよさそう。発症数が少ない場合、OR=ERRと考えてよいらしい。Tab2によるとモデルによってばらつきはあるが、低いモデルでも5。

2012-05-15 18:28:22
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka

@MAKIRIN1230 @leaf_parsley @sushikubo このデータでは発症率そのものはわからないが、1Gyだと発症率が5倍になる。事故時15才以下の人(論文は2005年なので)分析時は35才以下の人々に限定した結果であることに注意。

2012-05-15 18:28:48
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka

@MAKIRIN1230 @leaf_parsley @sushikubo 先日twしたように、原爆データでの10代被曝、30才のときのERR=4程度と類似した係数  http://t.co/399TtpEu p.729ではRonらの研究とも一致するとある。

2012-05-15 18:29:53
h■m■■k■(秘密保護中・反戦争法案) @ytkhamaoka

@MAKIRIN1230 @leaf_parsley @sushikubo データ収集部分、中途半端な理解で訂正があり申し訳ありませんが、とりあえず以上です。

2012-05-15 18:32:35
MAKIRINTARO @MAKIRIN1230

ありがとうございます。時間が取れるときにゆっくり確認させてください。 @ytkhamaoka @leaf_parsley @sushikubo

2012-05-15 19:50:31
Seiichi Ushikubo @sushikubo

@ytkhamaoka @MAKIRIN1230 @leaf_parsley ご指摘の通り、論文中に「analyzed by conditional logistic regression」とありました。計算できない理由が判りました。ありがとうございます。

2012-05-16 01:54:25
MAKIRINTARO @MAKIRIN1230

ロジスティック回帰分析 ~理論編 http://t.co/Myk8ih8q

2012-05-16 05:25:33

???  (T_T)

最初にご紹介いただいた、「素人のための疫学入門」がすごくわかりやすいです。

リーフレイン @leaf_parsley

あたしと同じく、浜岡先生のツイートが呪文に見えてしまっている方へ 全体的な概念の説明です→(PDF)http://t.co/1ljyZHo4 信頼区間については→http://t.co/5HHCNcE4

2012-05-16 04:10:58
リーフレイン @leaf_parsley

信頼区間の基本式 は t=(標本平均-母集団の平均(μ))÷(不変標本分散÷標本数の平方根) で求められます。 t分布の両側確率の換算表 http://t.co/ryN42Me7 です。 

2012-05-16 04:12:20

konamih先生から

こなみひでお @konamih

統計学の学びの勘所は,標本抽出が確率的な過程であり標本が持つ平均や分散などの統計量が特定の確率分布に従う確率変数であることを,しっかりと胸に落とすところにある。そこさえ押さえれば,あとは技術的な問題にすぎない。

2012-05-16 04:33:50
こなみひでお @konamih

高校数学における統計は,データの平均や分散などを求めることに終始しがち。ところがそこで求められる値は決まったものであって,確率的な性質をもっていない。そのままでは統計の真髄はつかめない。肝心なのはそれを確率と結びつけること。

2012-05-16 04:37:14
こなみひでお @konamih

高校の数学の教師に「データの集計と確率はどう結びつくのか説明してもらえますか?」とたずねて,明快な答が返れば合格。しかしそこで答えられない人は,経験的にはかなり多いようだ。そもそも彼らはきちんと勉強していないことが多い。

2012-05-16 04:40:19
こなみひでお @konamih

標本抽出はつまり,統計量の計算と確率論を結びつける中心的な概念。無作為抽出された標本の平均は 毎回揺れ動く。その分布の中心と広がりが母集団のもつ真の平均(母平均)とその分散(母分散)とどういう関係にあるかを知る。ここが母平均の区間推定のポイント。

2012-05-16 04:51:45
こなみひでお @konamih

まとめていうと,統計学というのは,ランダムに抽出されたデータの集合(標本)の統計量と,未知のカーテンに隠された量である母集団の統計量との間の関係を知るところにある。数学的な部分に目を奪われやすいが,大切なのはそこの概念的な理解。

2012-05-16 04:57:19
Haruhiko Okumura @h_okumura

p値の話というよりは,クラスの身長の平均等ではなくランダムなサンプルの統計量を扱わないと,統計量が確率変数であることがわからないということですね RT @ttmtko: …p値まではたどり着けません。 QT @konamih …確率と結びつけること。

2012-05-16 08:13:59
こなみひでお @konamih

そうです。社会事象からデータを集めて検定を行っている先進事例もあります。 RT @h_okumura:クラスの身長の平均等ではなくランダムなサンプルの統計量を扱わないと,統計量が確率変数であることがわからないということですね RT @ttmtko: @konamih

2012-05-16 08:27:59
Haruhiko Okumura @h_okumura

研究者の多くはエラーバーの意味をろくに理解していない http://t.co/rWaM65WQ 原文 http://t.co/lKf6TONl エラーバーのないグラフなんて><。ちなみに理系の多くの分野では標準誤差(±1σ)がデフォルトだと思う。95%CI等の場合は付記する

2012-05-16 08:45:33
Haruhiko Okumura @h_okumura

慶應の濱岡先生 @ytkhamaoka のサイト http://t.co/TLFpJ160 すばらしい。ここを理解するためにも,皆さんぜひ統計とRを勉強しませう

2012-05-16 16:04:21