ChatGPTなどの大規模言語モデルと日本の「個人情報保護」はどう関係してくる？高木浩光先生の見解 (2ページ目)

OECDガイドラインは初期草案ではfile概念を定義し対象をそれに限定していたが、米国代表等の注文で定義語が削除されていった経緯がある（その結果、日本の学説は趣旨を取り違えていった）のだが、その後、欧州でも古いと言われるようになった。1990年のデータ保護指令初期草案はfileに限定していたが…

2023-04-11 23:19:53

Hiromitsu Takagi @HiromitsuTakagi

…いたが、1995年成立までの修正で、fileに限定せず個人データの自動処理に限定（マニュアル処理のファイリングシステムも添えて）とした。古いと言われたのは、file定義が技術方式に基づくように受け取られたからで、技術方式に左右されない規制を意図したものであった。しかしその修正をしてもなお…

2023-04-11 23:31:59

Hiromitsu Takagi @HiromitsuTakagi

…してもなおfileに限定されているとの見解がドイツの学説に当時あった。fileを論理概念と捉えれば実質は同じだということ。米国のPA 1974も、a system of records（=file）に限定していたが、法制定後に同種の議論があり、個人についてretrieveする実務があれば該当とされたのは、同じ理屈である。

2023-04-11 23:42:34

Hiromitsu Takagi @HiromitsuTakagi

そのような論理概念を対象とするのは、法目的がデータによる個人に対する決定を問題の中心に据えていたからであり、2020年フランスConseil d’État判決が、体温測定カメラで自動判定して児童を退出させた公立学校の事案を個人データに基づく決定に該当と判断したのは、その法目的の端的な表出である。

2023-04-11 23:51:07

Hiromitsu Takagi @HiromitsuTakagi

以上を理解することで（日本の学説は理解していないが）ChatGPTに氏名で個人を指定してその人物に対する情報を表示させることこそが「個人データの自動処理」に他ならないとわかるだろう。これは2014年Google v. Spain事件よりも明確に該当すると言えるだろう。なぜなら… twitter.com/tsuj/status/16…

2023-04-11 23:59:20

辻正浩 | Masahiro Tsuji @tsuj

本日の辻正浩前科情報 by Microsoft Bing 普通に経歴を聞いても「彼は2002年に不正アクセス禁止法違反で逮捕された前科があります。」とプッシュしてくれるようになりました。ねぇBingさん。Bingさん…… pic.twitter.com/9E9kAoAWJw twitter.com/tsuj/status/16…

2023-02-23 00:08:52

Hiromitsu Takagi @HiromitsuTakagi

…なぜなら、Web検索は氏名での検索を特別扱いせず一般キーワード検索と区別していないから、個人データの自動処理を意図していないと言い得る余地もあった（日本法が検索エンジンを個人情報データベース等に該当しないする理由はそれ）が、ChatGPTでは明らかに個人に対する説明を応答してくるからだ。

2023-04-12 00:16:54

Hiromitsu Takagi @HiromitsuTakagi

実務的にもWeb検索をデータ保護法の対象とするのは若干の無理があった。氏名か否かを判断する方法がないからだ。実際、欧州でも中途半端なGDPR適用になっている。請求があった個人についてだけ対象とする削除権だけ適用されていて、正確性の確保など他の規律は適用されていない。これに対してChatGPT…

2023-04-12 00:26:33

Hiromitsu Takagi @HiromitsuTakagi

…ChatGPTの場合は実務的に適用可能と思われる。大規模言語モデルから応答を出力する過程の中で「ある個人について言及」という概念が浮き上がっているはずだから、そこを検出して、全ての個人に関する言及を止めてしまえばよい。正確性の確保が望めないので個人に対する処理をしなければよいのだ。

2023-04-12 00:30:54

Hiromitsu Takagi @HiromitsuTakagi

ただ、全ての個人について言及を止めてしまうわけにもいくまい。例えば歴史上の人物。これはデータ保護法でも対象外（死者は対象外）である。生存する学者の学説を出力するのを止めてしまうのはあまりに勿体無い。とはいえ不正確な解説をどうするのか難しいことになりそうだ。 twitter.com/HiromitsuTakag…

2023-04-12 00:35:45

Hiromitsu Takagi @HiromitsuTakagi

国会会議録とか小さいこと言わず、国会図書館のデジタル化文献の全てを学習くらいのことを言うべき。文献中の個人情報（散在情報）については冒頭ツイートのとおり。著作権についても、著作権は表現の保護であって概念の保護ではない。大規模言語モデルは概念の抽象化蓄積である。今こそ知の解放を。

2023-04-11 12:56:57

はじめ太郎 @hajime_old_man

takagi氏の見解。とても参考になる。 twitter.com/HiromitsuTakag…

2023-04-12 00:08:27

Hiromitsu Takagi @HiromitsuTakagi

ChatGPT等の大規模言語モデルに「個人情報保護」云々が政治課題化してきたようなので、取り急ぎ私見の概略を述べておきたい。個人データ保護法制に関係してくる側面は複数あるので注意。その一つ、公開文献等に含まれる個人情報（散在情報）を学習の入力とするのは同法制の外にあると言うべきである。 twitter.com/nikkei/status/…

2023-04-11 00:11:53

深津貴之 / THE GUILD / note.com @fladdict

よくまとまってるのでメモ twitter.com/hiromitsutakag…

2023-04-11 17:48:27

Shoichi Uchinami @ShoichiUchinami

僕が高木さんの見解をベースに学んできたから、という理由が大きいと思うけど、その通りだなと思うそしてデータ保護の根っことなる合意なき選別問題はさらにブラックボックス化が進んで、人間の手による選別と分けられなくなるのかな事前に民主的に決められたルールによる選別だけが許される未来か twitter.com/HiromitsuTakag…

2023-04-11 21:59:38