フィッシャーが(整備ではなく)利用したIrisデータセットは使ってはいけないのか?

本当によく考えた上で問題にしているのか感
5
Naoki Maejima @naoki_maejima

恥ずかしながら知らなかったんですが、かの有名なirisデータセットに関して、著者のロナルド・フィッシャーが優生学に傾倒していたことから、使用を控える流れになってきているんですね。代わりに提案されているのはパルマーペンギンのデータセットだそう🐧。 garrickadenbuie.com/blog/lets-move…

2022-02-08 17:42:59
kilometer @kilometer00

irisデータの論文が掲載された雑誌が、そのものズバリ「優生学年鑑」なので引用したくないですね…。あと歴史的な経緯でミスコピー版も出回っていて逐一チェックが必要です。 twitter.com/naoki_maejima/…

2022-05-13 08:22:34

注意:ミスコピーの懸念ですが、Rのdata(iris3)は問題ないようです

Ken McAlinn @kenmcalinn

じゃあBiometrikaはどうなんだろ。名前に優生学は入ってないけど、それを意図してるものだし。 twitter.com/kilometer00/st…

2022-05-13 11:22:21
uncorrelated @uncorrelated

もともとの優生学は人間の血統改良で病気を減らそうと言うもので、ナチスの安楽死計画は異端的なものらしいですし、フィッシャーさんも人種間に能力差があると言いつつも人種差別には反対していたようですし、毛嫌いするほどでもない気も。 twitter.com/kilometer00/st…

2022-05-13 09:41:32
ニュースの社会科学的な裏側 @anlyznews

「優生学と人間社会」を読んで左派のレッテル貼りを検証したら anlyznews.com/2016/12/blog-p…

2016-12-13 07:20:37
kilometer @kilometer00

毛嫌いするかどうかはともかく、手軽で使いやすいデータというよりも、背景にいろいろな問題を含んでいる使いにくいデータなので、それでもあえて使う理由ありますか?という理解です。 また優生学に関して、Fisherの立場を擁護するのは無理筋だと僕は思います。 twitter.com/uncorrelated/s…

2022-05-13 10:39:14
uncorrelated @uncorrelated

統計処理の例に扱いづらいわけでもないよく知られたデータを、データセットを整備した人の思想で避けるのは、目的に対して合理的な理由とは言えないので毛嫌いですね。 twitter.com/kilometer00/st…

2022-05-13 10:43:34
zorac @z0rac

代替データセットをその制作理由で批判するのも、また同じことの様に思えるが。 twitter.com/uncorrelated/s…

2022-05-13 11:15:09
ふなわ @hunawa_hunahuna

RT元では代わりになるデータセットが示されているから、扱いやすさに大差ないならそっちを使うのは合理的じゃないとまでは言えない...と擁護しようと思ったらそういうことではなかったらしい twitter.com/uncorrelated/s…

2022-05-13 11:15:47
kilometer @kilometer00

僕はデータを整備したヒトの思想はデータの一部であるため使用に際して考慮に値すると考えます。irisデータは現実世界の写像ですが、その写像の意図をまるっと無視して数値情報のみを議論するのがデータに対する合理的姿勢だ、という立場もひょっとしてあり得るのかもしれませんが。 twitter.com/uncorrelated/s…

2022-05-13 11:08:56
Minaka Nobuhiro 〈みなか食堂〉店主 @leeswijzer

「iris」データを実際に集めたのは,植物分類学者にしてデータアナリストだった Edgar Anderson なので,「Fisher 憎けりゃ iris まで憎い」というのは単なる “誤爆” ですね.Anderson のお友だちの John W. Tukey が化けて出てくるでしょう.ワタクシは iris データ愛用者です. twitter.com/naoki_maejima/…

2022-05-13 12:39:50
uncorrelated @uncorrelated

学術論文を査読するときに思想を聞くのですか? twitter.com/kilometer00/st…

2022-05-13 11:10:26
kilometer @kilometer00

もし僕が査読する論文がFisher論文を引用していたら、その意図(何のために何故そのデータが当該論文の趣旨に照らして必要なのか)を聞くと思います。 twitter.com/uncorrelated/s…

2022-05-13 11:19:50
uncorrelated @uncorrelated

引用の話では無いですよ。「データを整備したヒトの思想はデータの一部」と言う貴殿の主張からすれば、論文で使われているデータセットを取得した人の思想が分からなければ、不備のあるデータで査読をすることになります。それで貴殿の分野では、査読時に投稿者の思想チェックをするのですか? twitter.com/kilometer00/st…

2022-05-13 11:42:43
kilometer @kilometer00

「Fisherがどのような利用目的でどのようにirisデータを収集して整備したか」は当然、irisデータの一部だと思うのですが。彼の論文にもその点は明確に記述されています。書かれている内容が査読の対象になるのは当然です。 「思想」という広義に捉えられる言葉が誤解を産んでしまったかもしれません。 twitter.com/uncorrelated/s…

2022-05-13 12:12:05
uncorrelated @uncorrelated

フィッシャーが、アヤメの種類と特徴量のデータを優性思想の正当化のために整備したと言う御主張ですか? twitter.com/kilometer00/st…

2022-05-13 12:21:55
kilometer @kilometer00

当該の論文において主張されている通りです。 twitter.com/uncorrelated/s…

2022-05-13 12:32:55
uncorrelated @uncorrelated

フィッシャーはIrisデータセットをLinear Discriminant Analysisの例のために整備したわけで、Irisデータセットは優性思想の正当化のためではないですよね? twitter.com/kilometer00/st…

2022-05-13 12:40:15
kilometer @kilometer00

@uncorrelated 「著者の提案により頭蓋測定法に用いられ優れた成績を示している技術手法を分類学的問題に対して応用を試みる」という意図だと理解しています。

2022-05-13 13:07:35
uncorrelated @uncorrelated

@kilometer00 頭蓋測定と分類学への統計応用に何の問題があるのでしょうか?

2022-05-13 13:10:01
kilometer @kilometer00

@uncorrelated 本論文において著者が背景として頭蓋測定法を積極的に肯定している点は少なくとも要注意だと思います。またこの論文の表書きに付されている学術研究目的のための公開であるという旨に比して、「数値データが便利で使い易いから用いた」という理由で本論文を引用するのは適切だとお考えでしょうか。

2022-05-13 13:20:44
uncorrelated @uncorrelated

@kilometer00 頭蓋骨の分類に使えるテクニックをアヤメの分類に使ってみるよと言う話が、「頭蓋測定法を積極的に肯定している」とまで言えるのかが分かりませんし、頭蓋測定を否定しないといけない理由が分かりません。人体の計測はすべきではないとでも?

2022-05-13 13:25:13
1 ・・ 4 次へ