知識ゼロから学ぶAIのテス 信頼できないソフトウェアとそのテストのために / 高橋寿一さん

Developpers Summit 2024 15-C-4 02/15 12:40 ~ 13:20 https://event.shoeisha.jp/devsumi/20240215/session/4793
1
Developers Summit(デブサミ)🏔 翔泳社 CodeZine主催エンジニアイベント @devsumi

【デブサミ2024🛫】 #devsumi #devsumiC まもなく12:40よりC会場にて以下のセッションが始まります。 15-C-4 AI時代のソフトウェアテスト入門(シフトレフトするの?シフトライトするの?) 高橋 寿一

2024-02-15 12:27:00
Yasunobu Kawaguchi @kawaguti

セッションがすぐ満席になってびっくりしている。テストは普段日が当たらない #devsumiC

2024-02-15 12:40:49
Yasunobu Kawaguchi @kawaguti

11/16に第三版が出た。(書籍ブースで15% OFF サイン会もあるそうです) #devsumiC

2024-02-15 12:41:45
Yasunobu Kawaguchi @kawaguti

前回はシフトレフトでベストスピーカー。今日はシフトライトの話。 #devsumiC

2024-02-15 12:42:31
Yasunobu Kawaguchi @kawaguti

品質にかける費用負担はここ30年変わっていない。しかしバグは増えている。みなさん痛い思いすると思うんで参考になれば。Copilotは生産性高いし使ったほうがいい #devsumiC

2024-02-15 12:43:44
Yasunobu Kawaguchi @kawaguti

人間の書いたコードとCopilotのコードのどちらがいいかはよくわからないけど、たぶんCopilotの方が悪そう。ソースコードは凝縮度が上がって、テストの生産性は上がらない。TestPilotというのがあるがあまり使いこなしにくい。Copilotの生産性向上に追いつかない #devsumiC

2024-02-15 12:46:02
Yasunobu Kawaguchi @kawaguti

AIをテストするのは困難。GDPRでも面倒臭い規制が。巨大システムで、いつものテストケースを書くか?AI全盛マイクロサービスの時代に?コストがすごい膨らんで、終わらない問題。ということでかなりめんどくさい #devsumiC

2024-02-15 12:48:24
Yasunobu Kawaguchi @kawaguti

AIを使っている製品をプレスリリースすると株価が上がる。扱わざるを得ない。シフトレフトの考え方はより早い段階で見つけるほうがコストが安いという点に立脚するが、AIのモデルでは、作っている段階で見つけ出せない部分が多い。気まぐれ。シフトライトせざるを得ない。 #devsumiC

2024-02-15 12:51:15
Yasunobu Kawaguchi @kawaguti

実際のテストデータでテストせざるを得ない。シフトライト自体は以前からあって、パフォーマンステスト、探索テスト、カオスエンジニアリング、カナリアリリースなど。ここにAIの基本的なテストを持ってこないといけない。今日はめんどくさいって話をたくさんする。 #devsumiC

2024-02-15 12:52:39
Yasunobu Kawaguchi @kawaguti

QAが見るべき範囲が多すぎる。モデル、事前学習、リリース後の学習、データパイプライン、データのバイアス…。プロダクトマネージャーとデータサイエンスとQA、誰がどこをやるか。チェックってなるとQAお願いねってなったり。 #devsumiC

2024-02-15 12:54:44
Yasunobu Kawaguchi @kawaguti

ジェンダーや人種のバイアスが元データにあると結果にもバイアスがかかる。サンプリングデータが偏るケースはAIよくある。各国の人口とサンプリングデータはずれていて。その品質をどのように強化するか? #devsumiC

2024-02-15 12:57:53
Yasunobu Kawaguchi @kawaguti

AIは理系の技術と文系の考え方。(人工知能系出身者としてはわかりみが深い。認知科学とは切っても切れない #devsumiC

2024-02-15 12:59:08
Yasunobu Kawaguchi @kawaguti

GoogleのーAIテスト。ググると図が出てくる。 #devsumiC

2024-02-15 13:02:27
Yasunobu Kawaguchi @kawaguti

AIに関するテスト手法が極端に少ない。定量的に品質出すためのテスト手法をいろいろこねくり回してるけど、ここまで基準をクリアしたのでテストOKです、と言えない。 #devsumiC

2024-02-15 13:03:43
Yasunobu Kawaguchi @kawaguti

非機能テストはより細やかに対応しなければならない。 #devsumiC

2024-02-15 13:04:18
Yasunobu Kawaguchi @kawaguti

AIテスト技法の例。ニューロンカバレッジとメタモリフィックテスト。後者は入力値をずらした時に、結果のズレがエラーにならないかを見る。 #devsumiC

2024-02-15 13:09:32
Yasunobu Kawaguchi @kawaguti

テスト自動化は従来のテストでもROIの確保は困難だが、AIの場合は因果関係が書けないので、正解を定義することが難しい。出力がブレるし、出力が無限だったり。開発者やデータサイエンスの人が出荷判定基準を事前に決めないとつらい。テストはどう判断するかが難しい。定量で出ても判断が #devsumiC

2024-02-15 13:17:18
Yasunobu Kawaguchi @kawaguti

開発終わってからのテストがずっと長くなるので予算と人員の手配が必要になる #devsumiC

2024-02-15 13:20:23