フィッシャーが(整備ではなく)利用したIrisデータセットは使ってはいけないのか?

本当によく考えた上で問題にしているのか感
5
uncorrelated @uncorrelated

@kilometer00 また、教育や統計利用の啓蒙も学術研究目的に入りますし、そのために扱いやすいデータセットを選ぶのは目的整合的な合理的判断だと思います。

2022-05-13 13:26:05
kilometer @kilometer00

@uncorrelated craniometryはテクカルタームで優生学的な文脈において人種差別政策の肯定に用いられました。Fisherも当然その文脈で使っています。この論文ではcraniometryを肯定する前提が強調されています。それが問題となるかは議論が必要だと思います。

2022-05-13 13:37:07
kilometer @kilometer00

@uncorrelated おっしゃる通り教育・啓蒙が学術研究目的であること自体は僕も同意します。しかし僕ならこのような注意書きが付されたデータである点を考慮に入れ、他の選択肢を検討した上で、教育・啓蒙目的のために最適なデータを選択する方が合理的だと思います。

2022-05-13 13:37:16
uncorrelated @uncorrelated

@kilometer00 「この論文ではcraniometryを肯定する前提が強調されています」と言うのが理解できないのですが、この冒頭の話ではどう肯定しているんですか? pic.twitter.com/QTJnQ8AXuO

2022-05-13 13:41:30
拡大
kilometer @kilometer00

@uncorrelated 論文のイントロで自身の先行研究を引用する場合それは成功例として示されるのが一般的です。Fisherは当該論文で紹介されている自らの技術が頭蓋測定の改善に寄与しているという前提のもとにこの論文を執筆していると予想されます。これは僕の解釈ですので他の解釈の余地がないとは主張しません

2022-05-13 13:50:14
uncorrelated @uncorrelated

@kilometer00 Linear Discriminant Analysisが頭蓋測定に使えたと言うのは、頭蓋測定ではなくてLinear Discriminant Analysisをアピールする文ですよね?

2022-05-13 13:51:17
kilometer @kilometer00

@uncorrelated 少なくとも頭蓋測定法における本手法の成功は、この論文の意義を(特筆すべき程度に)強めると考えているとFisherは考えているという理解です。

2022-05-13 13:54:52
uncorrelated @uncorrelated

@kilometer00 また、この論文では、アヤメの種類と特徴量のデータによるアヤメの分類にLinear Discriminant Analysisが使えることを示しているわけで、優生学者にでは無く、分類学者に統計手法を売り込んでいますよね?

2022-05-13 13:55:25
kilometer @kilometer00

@uncorrelated もちろん、僕もこの記述を議論の余地なく黒であると断じているわけでは全くありません

2022-05-13 13:56:10
uncorrelated @uncorrelated

@kilometer00 むしろIrisデータセットは、Linear Discriminant Analysisがcraniometry以外でも有効であることを示しているわけで、IrisデータセットはLDAを頭蓋測定法から開放しているのだから、LDAと優生学と切り離していますよね?

2022-05-13 13:58:52
kilometer @kilometer00

@uncorrelated そのような解釈もあり得るかもしれません。私はどの解釈が正しいかという議論ではなく、解釈の余地がある、誤解される可能性がある、と主張しています。その場合、他の選択肢と比べた時にあえてirisデータを使うという合理的な理由は、僕には特に挙げられません。

2022-05-13 14:01:08
kilometer @kilometer00

@uncorrelated ついでに申し上げればirisデータには他の問題もありますので、そちらも併せて合理的にご判断されるのがよろしいかと思います。 twitter.com/kilometer00/st…

2022-05-13 14:01:14
kilometer @kilometer00

irisデータのミスコピー版についてはこちらに載っています。 "Will the Real Iris Data Please Stand Up?" Bezdek, et al., IEEE, 1999 lucykuncheva.co.uk/papers/jbjkrkl…

2022-05-13 10:45:42
uncorrelated @uncorrelated

@kilometer00 Irisデータセットは優生学とつながっているから問題がある、。「Fisherがどのような利用目的でどのようにirisデータを収集して整備したか」が重要だと主張されていたわけですから、それは論点すり替え論法という詭弁ですね。

2022-05-13 14:02:50
kilometer @kilometer00

@uncorrelated 「Fisherがどのような利用目的でどのようにirisデータを収集して整備したか」が重要である点についてはご同意いただけたようですね。その点について問題ないと解釈されている、という理解です。僕は上記のように議論の余地がある、という解釈です。

2022-05-13 14:04:33
uncorrelated @uncorrelated

@kilometer00 kilometerさんが「Fisherがどのような利用目的でどのようにirisデータを収集して整備したか」が重要だと主張していたと指摘しましたが、私が同意したとは言っていませんよ。詭弁を弄するのはやめましょう。

2022-05-13 14:06:01
kilometer @kilometer00

@uncorrelated 僕は「以上の議論から考えて、Irisデータセットには問題が無い」というuncorrelatedさんの解釈には賛同しません。僕が考える問題点については上記の通りで、それについて他の解釈が成り立つことも否定していません。これ以上の議論は必要でしょうか。

2022-05-13 14:14:21
uncorrelated @uncorrelated

@kilometer00 kilometerさんが並べてきた議論から考えて、Irisデータセットには問題が無い、kilometerさんの主張が破綻していると主張しているのです。

2022-05-13 14:06:49
kilometer @kilometer00

@uncorrelated 私からお尋ねしたいのは、uncorrelatedさんは、「Fisherがどのような利用目的でどのようにirisデータを収集して整備したかは重要か否か」という命題についてはどのようにお考えでしょうか

2022-05-13 14:14:39
uncorrelated @uncorrelated

@kilometer00 Irisデータセットでプラクティスする分には、データセットの整備した目的は、まったく重要ではないと思います。政治目的にあわせてデータセットをいじる可能性がある場合は考慮するべきときもありますが、Irisデータセットはそういうものでは無く、学問的には何の問題もありません

2022-05-13 14:19:52
kilometer @kilometer00

そうですか。それではこれまで全く重要だと思わない内容について長々と議論にお付き合いいただいていたのですね。ご苦労様でした。 僕はこの点を重要だと考えておりますが、上記の議論に加えて主張することは特にありません。 twitter.com/uncorrelated/s…

2022-05-13 14:38:26
uncorrelated @uncorrelated

@kilometer00 まったく重要ではないですね。科学的価値、つまり著者の主張の正当化への寄与を、どう左右するというのでしょうか?

2022-05-13 14:30:41
uncorrelated @uncorrelated

@kilometer00 Irisデータセットを整備した目的はその利用にまったく重要ではないですが、科学的な意義をどう左右するかも説明もなく、整備目的を理由にIrisデータセットの利用を止めるように言っているのは、科学的に不誠実な態度で、大いに問題だと考えていますよ。まぁ、今日はこの辺で。

2022-05-13 14:45:25
kilometer @kilometer00

@uncorrelated 「Irisデータセットの利用を止めるように言ってい」ません。僕は「引用しにくい」から「積極的に選ぶ理由がない」と言っているだけです。引用しにくい理由についてご同意いただけないならまあしょうがないですね。

2022-05-13 14:58:42

延長

kilometer @kilometer00

僕が「Irisデータセットの利用を止めるように言っている」という根拠はまだでしょうか。「科学的な不誠実な態度」を取っているという重大な指摘ですので、当然、具体的な確たる根拠をお持ちのはずです。お示しください。 twitter.com/uncorrelated/s…

2022-05-15 06:23:42
uncorrelated @uncorrelated

@kilometer00 Irisの代わりにパルマーペンギンのデータセットを使うように言っている人々を念頭においていましたが、kilometerさんは言っていませんね。なお、kilometerさんがIrisを避ける理由と、Irisの代わりにパルマーペンギンのデータセットを使うように言っている人々の理由が共通だと思って議論していました。

2022-05-15 06:43:22