【2017.05.25】立命館大学がpixivの公開制限R18作品を「猥褻・有害な表現」として無許可で公表した論文について(随時更新)
- BUHII_dayo
- 190631
- 588
- 50
- 89
↓関連まとめ
※コメントより
@hgchhg
社会科学だとまとめにある通り社会調査の手法としてアウトだし、自然科学でも過去に科学者の無知によってこの生物は絶滅しました、だから調査対象の取り扱いには注意しましょうみたいな知見が蓄積されてると思うんだけど、情報処理系って研究対象の扱い方が手法に組み込まれてない研究領域なのかね
@kisara_3939
工業大学の情報工学系出身だけど、自分のいた研究室では「アンケート用紙は外部に持ち出さない(教授のロッカーに鍵掛けて保存)」「協力者に匿名性を守る事を説明し、かつ同意を取ってからアンケート開始」は何が何でも守るように指示されたけどなぁ。
この件は(クローズドだけど)ネットに公開されてるモノだから、対面で行うアンケートのように協力者への配慮がいらないとでも思ったんだろうか?
@fragrant0131
kisara_3939 当方心理学科出身ですが同様ですね。
引用、研究倫理、妥当性に関しては学部生でも叩き込まれます
あのね、論文にのせる上で同意をとって統計的に処理しなきゃいけないのは小説のような公表された表現物ではなく、たとえばそれを書いたときの心情データとかそういう「現実世界の個人に関する生身の情報」。でもオタクにとっては表現物も生身の身体の一部であり、そこは理解して尊重してほしいて話
2017-05-25 10:36:54立命館の件、小説など公表された表現物を学術研究の対象として分析する場合、作者の許可も同意もいらないよ。ただ客観的には公表された表現物でも、本人的には個人情報にも近いプライバシーみたいなもの(うまく言えないけど)で、それはそういう文化として尊重するべきだったね、という話
2017-05-25 10:33:20立命館の件、引用の範囲は満たしてるから腐の狭いルールは適用できない(ドヤ 的なコメントが散見されて頭を抱えるなど。 学術論文でこんなハラスメントぶちかましてたら、学会が世間に受け入れられなくなっちゃうだろ! 人工知能学会で起きた文化女中機学級会の件は記憶に新しい…くもないか
2017-05-25 01:14:47■論文の設計が杜撰
※後述しますが、これは他大学の教授も指摘しています→https://srad.jp/~yasuoka/journal/612256/
二つ目に調査設計があまりに杜撰であるという事、この場合有害なサイトを弾くためにAIで判別するための研究だからゾーニングされてるサイトを選択するのは間違いだしそもそも小説の語彙と援交などの単語を検索で見つからないように伏せる語彙は全く関連がないのに何故pixivを選んだのか、となる
2017-05-25 02:43:31立命館の論文は有害なサイトのフィルタリングをAIで行うために有害な語彙をAIで判別し弾くための足がかりとしての研究なのに、有害なサイトで使われる語彙と女性向けR18小説で使われる語彙は全く違うにも関わらず、ゾーニングされているpixivのR18ランキングを参考にしてるのがダメ…
2017-05-25 02:32:37pixivはゾーニングされてるんだからまず有害なサイトとしてサンプルに上げるのは間違ってるし、有害なサイトを弾くための隠語を調査するならR18小説から引いても何の参考にもならないし、そもそもBLの隠語調べても援交サイトなどの問題解決の足がかりにはならない
2017-05-25 02:17:41なにやら立命館の論文でざわついてると思ったら…うわあお、これはまたものすごい論文だこと… あの、官能小説はなにも今に始まった話じゃなくてですね、探せばその類の小説は結構出てくるはずなんですよね、敢えてpixivのR-18持ってこなければ研究ができなかった理由があるのでしょうかね
2017-05-25 01:45:32「なんでウィークリーランキングから10本だけ選んだんだ?」で首を傾げていたのだけれど、単にあの立命館の連中、pixivの無料アカウントしかないから人気順検索使えないのでウィークリーランキング(これは無料会員でも使える)から引っ張ってきただけで、それくらい安直かつ粗雑なのでは。
2017-05-25 03:32:35というかね、わずか10作品でドヤ顔して人工知能学会で発表とか「お前らのAIって無能すぎねえかいっそ人工無能学会と改名しろやボケ」くらい煽るよ? MIIとかでこんなサンプル数でやったらB4でもブッ叩かれるわ(笑) twitter.com/r_fusoh/status…
2017-05-25 01:13:15直接的に「有害情報(である)」とはしていないけど、「猥褻な表現(が含まれる)」として扱っているのは釈然としない。 前者についても「その抽出用のサンプルとして用いている」以上、「当人達がそのもの、あるいはそれに近しいものと認識していた」と読まれても言い逃れができない。
2017-05-25 00:58:48pixiv小説のテキストデータで分析なら、まずメタデータ10万件あつめて、そこから3000件くらいランダムサンプリングして、そこからだよなあ。
2017-05-25 18:35:26立命館大の院生の研究発表、「なんで誰もあれ止めなかったんだ」の一言なんだけど、起こってしまった以上はいろんなところに傷跡を残すのは必然だろう。残念すぎる
2017-05-25 19:10:56自分はまだやったことはないが、pixivのテキストを活用した研究は、コミュニティに好意的で十分配慮されたちゃんとしたものであっても抑制されそうなあたり、ほんといろいろ残念。
2017-05-25 18:53:50前に読んだが,量的調査で比較しないと客観的ではっきりわかりやすく言えないのはそうだけど,特定のフィールドを扱った研究にはいろいろ難しいことがあってなかなかそうはいかないんだよ,という率直ないい話が交わされてる良い対談だった。 synodos.jp/society/19195
2017-05-25 20:05:05立命館の論文例の論文を読んでる。1行目で死んだ。 「インターネット上には未成年に対して有害な情報が溢れている。(断定)」 いいか、こういう時には「有害とされる情報の存在が指摘される」みたいに書くんだよ。「有害」の定義もせずに断定しちゃダメだよって、これ学部生の卒論ですかね…。
2017-05-25 14:41:11×「インターネット上には未成年に有害な情報に溢れている」 ↓ ○「誰もが情報発信者となるインターネット上には多様な情報が集積する。その一部に含まれる青少年への「有害」性が疑われる情報についてどう対応するべきかという議論は、近年工学から政治に至るまで幅広い分野で考察されてきた。」
2017-05-26 09:50:41「有害な情報」を考えるという建付で始まったのに、「表現」の話になって、その後「直接的な性表現とは例えば,性器や性行為を表す単語である」だぞ。おいおい、いきなり自然言語だけ考えることになってんぞー、もうちょっと落ち着いて書けー…ってまだ第2段落にしてこのレベル。
2017-05-25 14:43:51「3.2データからの文の切り出し」なんて節は要らねぇな…形態素解析で苦労したの? でもこういうのは要らないよ。3.3で「猥褻な表現を分類する」という話になってるが、ここまでで一度も「猥褻」が定義されてねぇ。少なくとも考察してねぇ。
2017-05-25 14:49:17