コンピュータWatson vs クイズ王の対戦 - Jeopardy!

IBMのコンピュータWatson が、米国のクイズ番組 Jeopardy! で Ken Jennings氏・Brad Rutter 氏と対戦しました。3日間のテレビ放映の模様を解説したものです。
11
IBM Research - Tokyo @IBMRes_Tokyo

本日(US時間2/14-16夜)から3夜連続で、Watson君vsクイズ王の対戦が放映されます。日本では残念ながらReal Timeでは見れないのですが、とりあえず興味がある方はこちらをフォロー! @IBMWatson

2011-02-15 10:36:09
IBM Research - Tokyo @IBMRes_Tokyo

ウチの所長もつぶやいてますね @NolyMorimoto スーパーコンピュータのクイズ王チャレンジ一日目、Watsonは、一位タイでした。いよいよ、明日は、人間の知能と雌雄を決することに。。。

2011-02-15 11:51:05
IBM Research - Tokyo @IBMRes_Tokyo

クイズ番組Jeopardy!で、歴代最強の二人との対決を実現したコンピュータ「Watson」の開発に参加した研究員、金山が、先ほど米国で放映された内容についてご説明します。

2011-02-15 17:26:10
IBM Research - Tokyo @IBMRes_Tokyo

三夜連続で、二回戦の試合が繰り広げられます。一日目(USの2/14夜)には一回戦目の前半が放映されました。この後、2/15夜に一回戦目の後半、2/16夜に二回戦目全体が放映されます。どちらが勝つか、最後の結果が出るのは、日本時間だと2/17の午前9:25頃になるでしょう。

2011-02-15 17:28:58
IBM Research - Tokyo @IBMRes_Tokyo

一日目(一回戦目前半)は、Watson が快調にスタートしたものの、Brad Rutter氏の追い上げがありました。最後には Ken Jennings氏$2,000、Brad Rutter氏$5,000、Watson が$5,000 となりました。

2011-02-15 17:32:06
IBM Research - Tokyo @IBMRes_Tokyo

なんとBrad氏とWatsonが一位で同点です! なお、全員がキリの良い数字になっているのは偶然であります。

2011-02-15 17:33:00
IBM Research - Tokyo @IBMRes_Tokyo

一日目に面白かったのは、Ken Jennings 氏が間違えた答えをした直後に、Watsonが同じ答えを言ってしまい、点数を引かれたこと。残念ながら音声認識はしていないので、このようなミスもあり得るのです。ある種のハンデということで…

2011-02-15 17:34:56
IBM Research - Tokyo @IBMRes_Tokyo

前半でいきなり Daily Double(得点を倍にするチャンスのパネル)を引き当てたところも圧巻でした。もちろん運の要素もあるとはいえ、過去の傾向から緻密に予測をしたりしてるのですよ。

2011-02-15 17:37:03
IBM Research - Tokyo @IBMRes_Tokyo

いくつか誤答があったとはいえ、Watsonが幅広い知識を蓄えているのが見えました。この後、さらに難しい問題が出てくるうえ、配点も高くなってきますが、人間とコンピュータはどちらが勝つでしょうか? 明日以降もお楽しみに!

2011-02-15 17:39:13
IBM Research - Tokyo @IBMRes_Tokyo

いくつか誤答があったとはいえ、Watsonが幅広い知識を蓄えているのが見えました。この後、さらに難しい問題が出てくるうえ、配点も高くなってきますが、人間とコンピュータはどちらが勝つでしょうか? 明日以降もお楽しみに!

2011-02-15 17:39:13
IBM Research - Tokyo @IBMRes_Tokyo

詳しくはこちら… http://www.ibmwatson.com 英語ばかりで恐縮ですが、動画等が充実しています

2011-02-15 17:40:13
IBM Research - Tokyo @IBMRes_Tokyo

Watson vs クイズ王2日目、金山研究員が後ほど日本語で解説します → Day 2 Recap from #IBMWatson lead researcher Dave Ferrucci #jeopardy http://fb.me/V7o81eAz

2011-02-16 18:43:43
IBM Research - Tokyo @IBMRes_Tokyo

米国時間の昨晩、"Jeopardy! the IBM Challenge" の2日目が放映されました。2回戦形式のうち、1回戦目の後半です。昨日に続いて、研究員の金山が概要を解説します。

2011-02-16 20:05:35
IBM Research - Tokyo @IBMRes_Tokyo

配点が倍になった Double Jeopardy! ステージでは、Watsonがいきなり7問連続で正解しました。さらに、3人とも間違えた問題を挟んで、なんと13問連続正解です! 特に配点の高い$1600, $2000の問題は、残りの2人に1問たりとも譲りませんでした。(金山)

2011-02-16 20:07:50
IBM Research - Tokyo @IBMRes_Tokyo

得点倍増のチャンスである「Daily Double」のパネルを2つとも獲得しました。掛け金には $6,435 という普通の人には思いつかないような金額を指定して会場を驚かせました。これは過去のシミュレーションの結果から計算された最適な値です。(金山)

2011-02-16 20:09:40
IBM Research - Tokyo @IBMRes_Tokyo

もう一回の Daily Double でも、$1,246という半端な金額を賭けました。早押し形式ではない特殊なケースなので、確信度が低いものの「たぶん…(I'll take a guess...)」と言いながら見事に正解しました。(金山)

2011-02-16 20:12:02
IBM Research - Tokyo @IBMRes_Tokyo

Watson がいとも簡単に正解してしまうので、答えを探すのはコンピュータにとって簡単すぎると思われてしまうかもしれません。しかし、問題のジャンルは多様で、答えのデータベースを予め作っておくような「丸暗記」は不可能です。(金山)

2011-02-16 20:13:08
IBM Research - Tokyo @IBMRes_Tokyo

Watson は、問題文の中にあるキーワードをもとに検索をかけて、答えの候補を探し、それぞれが答えとして合っているかどうか、その根拠が書かれている文書を再び探しにいきます。問題文とまったく同じ記述が過去の文書に見つかることは稀なので、うまく一般化しなければいけません。(金山)

2011-02-16 20:18:19
IBM Research - Tokyo @IBMRes_Tokyo

さまざまな観点から「根拠」を探して、ある答えに対する確信度を積み重ねていく、といったような計算を、大量の答えの候補に対して並列で実行します。その結果、最も良さそうな答えの確信度がある値を超えた時、「この問題には答えられる!」と判断して、ボタンを押すのです。(金山)

2011-02-16 20:21:50
IBM Research - Tokyo @IBMRes_Tokyo

30問のパネルをめくり終わった時には、Ken Jennings 氏 $2,400、Brad Rutter氏 $5,400 に対し、Watson は $36,681 という圧倒的な差を付けてトップに立ちました。(金山)

2011-02-16 20:23:37
IBM Research - Tokyo @IBMRes_Tokyo

最後の問題「Final Jeopardy!」は、早押し形式ではなく、筆記形式で全員が答えます。問題のカテゴリ(分野)が与えられて、問題文が出てくる前に、解答者は持ち点の範囲内で掛け金を決定します。今回のカテゴリは「米国の都市」。(金山)

2011-02-16 20:24:39
IBM Research - Tokyo @IBMRes_Tokyo

「この都市の空港は、第二次大戦で二番目に大きい戦いで活躍した軍人にちなんで名付けられました」という問題。Ken, Brad は正しい都市名を答えて、それぞれ得点をほぼ倍増させました。(金山)

2011-02-16 20:27:14
IBM Research - Tokyo @IBMRes_Tokyo

Watson の答えは「What is Tronto?????」。疑問符5つに自信の無さが表れています。しかも、Tronto は米国の都市ですらありません。(金山)

2011-02-16 20:29:05
IBM Research - Tokyo @IBMRes_Tokyo

とんでもない誤答をしつつも、Watsonが賭けた金額はたったの$947で、堂々と首位をキープしました。「米国の都市」は意外と答えづらい問題であることを過去の経験から学んでいたのでしょう。これも戦術の一つです。(金山)

2011-02-16 20:31:12