ChatGPTは二次方程式が解けるのに,足し算ができない?

日経サイエンス2023年8月号の特集を編集部が解説します。
6
出村政彬 Masaaki Demura @DemuraMasaaki

ChatGPTは2次方程式や確率の問題に正解できる一方で足し算の繰り上がり操作をしないなど,「中途半端」に数学を解きます。解法がでたらめで答えだけ合うことも。どう中途半端なのか,こちらのYoutubeにもまとめてみました。 youtu.be/h7JbssQC3Xk

2023-06-23 14:43:38
拡大
出村政彬 Masaaki Demura @DemuraMasaaki

特集では足し算をするAIが一体何を習得しているのかを探ると同時に,「数学の認知神経科学」を通じて足し算をする人間の頭のなかを探ります。一見すると全く異なる仕組みで動いていそうなこの「2種類の脳」に,意外な共通点があることがわかってきました。

2023-06-23 14:46:40
出村政彬 Masaaki Demura @DemuraMasaaki

今回の取材で「数学の認知神経科学」という分野があることをはじめて知りました。 私たちの脳はどう数学を学ぶのか。脳はどのように数学を解くのか。それは,ヒトにしかない脳機能の解明を通じて「ヒトらしさ」とは何かを探る試みでもあります。 twitter.com/TomNakai/statu…

2023-06-27 18:34:10
Tomoya Nakai 中井智也 @TomNakai

日経サイエンス「特集:数学する脳とAI」にて、アラヤ金井さん@kanair_jp、藤澤さん@ifuiaa の研究とともに、私の数学の認知神経科学研究を紹介していただきました。 ChatGPTを題材に、AIとヒトの数学処理はどのような点で似ている/異なるのかという話をしています。 nikkei-science.com/page/magazine/…

2023-06-27 06:58:08
出村政彬 Masaaki Demura @DemuraMasaaki

ヒトの脳機能を探る研究はこの10年あまりで大きく進展しました。その原動力は深層学習などのAIの存在です。優れたAIはヒトの脳の仕組みを映し出す鏡となります。Transformerや大規模言語モデルを道具とすることで,今後,私たちの脳の働きにもっと迫ることができそうです。nikkei-science.com/202308_028.html

2023-06-27 18:39:05

文章題ならいけるのか?

ChatGPTに数学ゲームに挑戦してもらったところ…

日経サイエンス @NikkeiScience

2023年8月号の特集【数学する脳とAI】 日経サイエンスの『パズルの国のアリス』はChatGPTはどれくらい解けるのかな…?と6月号の問題を流し込んでみたら,しっかりと間違えてくれました😂 「最長のスタンプラリー・ルートを探せ!」 nikkei-science.com/page/magazine/… pic.twitter.com/4Y1U7K8PUZ

2023-06-28 14:53:26
拡大
リンク 日経サイエンス - 一般読者向けの月刊科学雑誌「日経サイエンス」のサイトです。 最長のスタンプラリー・ルートを探せ!(問題) - 日経サイエンス 近隣の住人にしかあまり知られていないが,鏡の国にも温泉がある。東ナイト駅の北に建設中の新しい鏡の国博物館から,
縞うさぎ/詫摩雅子 @shima_usa96

@NikkeiScience @shigenokura 面白い間違え方をするなぁ。最短が3.8kmというのはあっているのだけれど……。最長が最短よりも短くなっていることに気がつかないっていうのが面白い。

2023-06-28 15:39:13
日経サイエンス @NikkeiScience

@shima_usa96 @shigenokura ドヤって最短と最長を間違えていますし,まだ小数点の計算も苦手なようです。 最後の文章題だけ読んでるようですし。今編集長がちょっと面白い実験?しています。

2023-06-28 15:52:41

ChatGPTに10ケタの足し算させてみた。

一号が「パズルの国のアリス」に挑戦させている間,編集長がChatGPTで試していたのがこちら

出村政彬 Masaaki Demura @DemuraMasaaki

ChatGPT(GPT-3.5)に10ケタの足し算100題を出してみたら興味深い結果に。 ・答えが11ケタになると解けない傾向がある ・計算結果をケタ別に見て,下から5ケタ目と8ケタ目に間違いが集中…… いったい何なんでしょう,これ。すごく面白い (図は計算の正否を青,ケタ別に見た数の正否を水色で着色) pic.twitter.com/6YPZ8LILZb

2023-06-28 17:56:32
拡大
拡大
出村政彬 Masaaki Demura @DemuraMasaaki

答えが10ケタだと計算がうまくいくのに11ケタになると途端に間違う,という話は最新号の記事「ChatGPTが映し出すヒトの知性」の話とちょっと似ている。 pic.twitter.com/GMg1LQlfq1

2023-06-28 18:09:04
拡大
出村政彬 Masaaki Demura @DemuraMasaaki

(ちなみに今回はこんな感じで100題を一度に解かせたので,厳密性を期すなら1題ずつ解かせた方が良さそう) pic.twitter.com/EupdlgfIKO

2023-06-28 18:09:50
拡大
出村政彬 Masaaki Demura @DemuraMasaaki

同じ方法でGPT-4でも計算させてみた。結果が全然違う。 途中までは11ケタの計算にも対応できていて,5ケタ目と8ケタ目だけミスるGPT-3.5の変なクセも解消されているっぽい。後半は全く計算が合わなくなってしまったのがまた謎なのだけど。。 pic.twitter.com/bglw2lExE1

2023-06-28 18:17:10
拡大
出村政彬 Masaaki Demura @DemuraMasaaki

ちなみに8月号で大規模言語モデルやTransformerに足し算を解かせる話を詳しく取り上げているので,ぜひこちらもご覧頂ければと。 amzn.asia/d/7yZWFWO

2023-06-28 18:38:38
出村政彬 Masaaki Demura @DemuraMasaaki

足し算の話の部分をちょっとちら見せ。 pic.twitter.com/uaWDrdJdYY

2023-06-28 18:43:03
拡大
出村政彬 Masaaki Demura @DemuraMasaaki

ChatGPTを使うと勝手に会話の題名がつきますが,昨日の10ケタ足し算をやらせた時の会話にこんな題名がついていることに今気付きました。 Addition calculations in 4 words 4単語? 1つの数を複数の単語の組み合わせとして認識してるのでしょうか。5,8ケタ目に間違いが集中するのと関係がありそう? twitter.com/DemuraMasaaki/…

2023-06-29 11:51:39

ChatGPTと数学,夏休みの自由研究ネタになりそうですが
まだ足し算そのものを任せるのは不安が残るようです。

他にも気になる科学ニュース盛りだくさんの8月号です。
どうぞよろしくお願いします。

ChatGPTに数学で負けたくない人におすすめ

数学パズルの迷宮

坂井 公,斉藤重之