「データ」を得る二通りの方法

「データを得る二通りの方法」について@ynabe39 さんのツイートをまとめました。(注: 本来の文脈から切り取ったまとめです。まとめ内のツイートと本来のツイートの意味が違ってる可能性があります)
0
渡邊芳之 @ynabe39

なにかの「事実」を証明する「データ」を得る方法には大きく2つがあって,ひとつは「自分でデータをとること」,もうひとつは「既存のデータを利用すること」である。

2011-10-24 13:07:18
渡邊芳之 @ynabe39

「自分でデータをとること」によって得られるデータには「枚挙的なデータ」と「仮説検証的なデータ」がある。前者のデータを得る代表的な方法は観察や観測であり,後者のデータを得る代表的な方法は実験である。

2011-10-24 13:08:33
渡邊芳之 @ynabe39

「枚挙的なデータ」によって得られる知識は帰納的な知識で,「仮説検証的なデータ」によって得られる知識は演繹的な知識である。

2011-10-24 13:22:49
渡邊芳之 @ynabe39

「既存のデータを利用する」とは,もともとその事実を証明することを直接目的にはせずに,多くの場合は他の研究者や機関によって得られたデータを援用して,なにかの事実を証明しようとすることである。

2011-10-24 13:28:14
渡邊芳之 @ynabe39

「自分でデータをとる」場合には,証明したい事実とデータの収集方法,得られたデータは少なくとも研究者の頭の中では直接連結されている。問題になるのは主にデータの収集方法や測定方法に関連した妥当性の問題である。

2011-10-24 13:29:53
渡邊芳之 @ynabe39

「既存のデータを利用する」場合には,研究者が証明したい事実とそのデータとの連結が保証されるのかという妥当性の問題の他に,利用されるデータの包括性の問題が生じる。端的に言って「都合のよいデータだけを集めてきていないか」「自説に都合の悪いデータを無視していないか」いうことだ。

2011-10-24 13:33:17
渡邊芳之 @ynabe39

妥当性の問題についてはそれをチェックするさまざまな方法が提唱されていて,多くの研究者はそれに気を使う。しかし包括性の問題については「研究者間の相互批判」しか,チェックする方法はないと思う。「お前はこのデータをなぜ無視したのだ?」と誰かが批判する,ということだ。

2011-10-24 13:38:09
渡邊芳之 @ynabe39

自分でデータをとる場合に「自分に都合のよいデータだけを計画的に得る」ことはけっこう難しい。「不都合なデータを無視する」ことにも(統計的検定などでサンプルサイズが重視されることから,そして研究倫理の面から)限界がある。

2011-10-24 13:41:18
渡邊芳之 @ynabe39

いっぽう「既存のデータを利用する」場合には,研究者には「自分に都合のよいデータだけを集めるフリーハンド」が与えられる。その時にそのフリーハンドを抑制するものは,ひとつは研究者養成教育であるし,ひとつは研究者の相互批判である。

2011-10-24 13:43:35
渡邊芳之 @ynabe39

いつも「単純だ」といわれるのでここでもあえて単純に言えば「研究者はできるだけ自分でデータをとるべきである」。

2011-10-24 13:44:51