131109 『ビッグデータの正体』で述べられてたことのまとめとか

ベストセラー『ビッグデータの正体』で述べられていたことのまとめ。マイノリティレポートのような技術が実現したときに法的にどう対処すべきかも。
1
弦音なるよ @naruyo_t

グーグルは検索結果を解析し、インフルエンザ流行の兆候を医療機関よりも早く察知した。膨大なデータの解析から様々な事象を明らかにする「ビッグデータ」が注目されてる。そこでベストセラー『ビッグデータの正体』を読んでみた(激しい今さら感)。 http://t.co/FIPcj6xLCH

2013-11-09 19:29:18

『ビッグデータの正体』まとめ

弦音なるよ @naruyo_t

ビッグデータの3要素は(1)全てのデータを扱う、(2)データの精度は気にしない、そして(3)因果関係より相関関係。 (3)について、例えば「オレンジの車は故障率が低い」ことがデータからわかれば、原因がなぜかは気にしない。根本療法は取れないけど、対処はできるのでそれで良しとする。

2013-11-09 19:30:09
弦音なるよ @naruyo_t

膨大なデータからは未来も見える。ある自動車メーカーは、データ解析により部品の課題を発見し、改善手法を見つけることができた。おもしろいのは、自動車メーカーは部品メーカーにその結果を教える前に、特許を取得し、特許の売却で利益に繋げることにしたところ。

2013-11-09 19:30:23
弦音なるよ @naruyo_t

人より早く未来を予測し、アイディアでいいから特許を取って、これを売る。というのは特許出願の基本的な考え方(特許法は完成された発明を想定してるけど、実務的には妄想レベルでも出せたら出すよね)。その点、高い精度で未来予測できるビッグデータは、特許の使い方にも影響がありそう。

2013-11-09 19:32:11
弦音なるよ @naruyo_t

モノを作らないが研究開発を行い、特許を作ってライセンスで稼ぐ。名前は出さないけどそういう会社たちにとって、ビッグデータによる予測は強力な武器になるだろう。

2013-11-09 19:32:41
弦音なるよ @naruyo_t

気になるのが「因果関係より相関関係」というビッグデータの特徴。ビッグデータは原因の追究よりも事実の可視化に長けており、発明が解決しようとする課題の本質までは教えてくれない。もちろん「こんな事実がわかったのでそれに対処しましたよ」で、特許明細書のストーリーは十分作れそうだけど。

2013-11-09 19:33:35
弦音なるよ @naruyo_t

『ビッグデータの正体』では、現在ビッグデータに関わる企業のタイプや、将来仕事がどう変わるかなど、体系的に分析されてておもしろかった。『マイノリティ・レポート』みたいに、未来に発生する犯罪も高確率で予測できるようになるけど、どうする? という課題に対する対策案も的を得ていた。

2013-11-09 19:34:21
弦音なるよ @naruyo_t

知財との絡みで特に興味深かったのは、データを無体財産として見たとき、その資産価値をどう評価するかという問題。フェイスブックの抱える膨大なユーザー情報は金のなる木だが、現状では資産価値を計る方法がなく、帳簿にも載らない。

2013-11-09 19:34:46
弦音なるよ @naruyo_t

無体財産の価値評価や金融商品化、ライセンススキームについては、特許の世界の方が検証が進んでいるように思う。このあたりをアナロジーとして、データの価値評価手法を考えることができるかも。これはそのうちブログの方で書きたいテーマ。

2013-11-09 19:35:10

質問への回答(マイノリティリポートにどう対処するか)

New K @biru_geitsu

@naruyo_t どうするの?>マイノリティリポート

2013-11-10 11:30:19
New K @biru_geitsu

@naruyo_t 風が吹いたら桶屋が儲かる(予言)

2013-11-10 11:29:23
弦音なるよ @naruyo_t

「風が吹く」と「桶屋が儲かる」という事象のみ事実として教えてくれるのがビッグデータ。なぜ風が吹くと桶屋がもうかるのかの因果関係まで明らかにするのが従来型の分析(この違い後で出てきます) RT @kei_koizumi: @naruyo_t 風が吹いたら桶屋が儲かる(予言)

2013-11-12 02:15:15
弦音なるよ @naruyo_t

1)マイノリティ・レポートの件について回答。 ビッグデータを用いた未来予測が可能になった時に、発生が予測される犯罪に対しての、『ビッグデータの正体』で述べられていた考え方。

2013-11-12 02:09:23
弦音なるよ @naruyo_t

2)結論から言えば「裁いてはいけない」。 例えば未来の犯罪を80%の確率で当てられる場合、5人に1人は冤罪で捕まることになる。推定無罪の原則下では、100%の証拠がない限りは裁くのはダメ。 (日本の司法は推定有罪で運用されてね? というツッコミはここでは控えること)

2013-11-12 02:10:04
弦音なるよ @naruyo_t

3)そもそもビッグデータは相関関係しかわからないのに、犯罪みたいな因果関係が問題となる事例にまでつい当てはめたくなっちゃうところに問題がある、というのが『ビッグデータの正体』での指摘。

2013-11-12 02:10:28
弦音なるよ @naruyo_t

4)『ビッグデータの正体』では犯罪の他に、例えば保険や雇用のような個人情報の予測が問題になる例を挙げていた。 プライバシーに関し現状では「データ利用の事前告知」「データ利用の本人拒否権」「匿名化」の3つで対処されるが、高精度の予測が可能なビッグデータの前では意味をなさず、問題。

2013-11-12 02:10:49
弦音なるよ @naruyo_t

5)これに対する解答案が、「してはいけない予測や利用法」の制定と、これを実効させるための監査機関の設立だった(モデルは現行の会計制度)。また、データ自体にボカシを入れることなども提案されていた。詳しく書かないけど、このあたりはおもしろい提案のように思った。

2013-11-12 02:11:26
弦音なるよ @naruyo_t

終)話ずれるけど個人的にはフォードの話が好き。 もしフォードが当時マーケティングしてたら「もっと速い馬が欲しい」という答えを得たはずだが、実際に彼が作ったのは自動車だった。という有名な話について、ビッグデータもまた「市場のニーズはもっと速い馬」という答えしか出せない、というお話。

2013-11-12 02:12:58
弦音なるよ @naruyo_t

ということで、いい質問すぎて雄一おじさん並みに慌てちゃったけど、遅くなったけど本文の方で回答しました @kei_koizumi: @naruyo_t どうするの?>マイノリティリポート

2013-11-12 02:16:05
弦音なるよ @naruyo_t

ごめん後で出てくると書いたけど出てこなかった。あと桶屋の話はなかなかニヤリとさせられる鋭いコメントだなと思った @:「風が吹く」と「桶屋が儲かる」という事象のみ事実として...のが従来型の分析(この違い後で出てきます) @kei_koizumi: 風が吹いたら桶屋が儲かる(予言)

2013-11-12 02:31:12
New K @biru_geitsu

@naruyo_t わざわざありがとう。想像以上に納得できる話だった。僕的にはマイノリティレポートより『ガタカ』っていう映画が印象強い。精度についてはテクノロジーの進歩とか人工知能との組み合わせとかで、将来どうかなったりするんだろうかね。

2013-11-12 08:56:33
弦音なるよ @naruyo_t

@kei_koizumi ガタカは好きな映画!現実にデザインベイビー増えてるけど、いずれ大がかりな規制入るのかな。価値観も変わってくんだろな。バイオ技術の進歩に関してはキリスト教圏の対応も気になるところ。クローン羊であれだけ揉めてたけど、今の技術はそれどころじゃない。

2013-11-12 23:38:27

『データサイエンティスト養成読本』も