意見募集ツイート
【緩募】皆さんが国産LLMに期待することを教えてください。日本の将来あるいは日本語のために重要で「これは国内でやるべき/外国勢はやってくれない」と思われる事柄には国内で協力体制が作れると思うので(弊社がするかに限らず)何をすべきか幅広い視点を持つためリプライ/DMでアイディアをください。
2024-04-20 16:16:20国産LLMと言いましたが、データセットや産業応用まで広い範囲でアイディアがあればそれらも大変ありがたいです(ただ、ロックインされずにデータ資産を蓄積するのには、国内で自由に使える(交渉の余地がある)LLMが不可欠だとは思っています)
2024-04-20 17:00:23アイディア (時系列順)
@imos LLM活用はITに限らず社会の隅々まで浸透していきインフラになると思います。そういう状況で急に日本語対応を一気に止めるとか、政治的バイアスを仕込むとかされると国家安全保障に関わると思います。そうならないように、日本のための実装と運用保守は必須だと思います・・・
2024-04-20 16:35:45@imos 日本の法律や道徳に沿っていたり、仏教や神道、日本の歴史に詳しいというのはやっぱり国産じゃないと実現できないと思います。
2024-04-20 16:38:36日本でLLM関係の研究推進することについて個人的に最も重要だと思ってるのは「問題の大小に関わらず言語モデル関係に自力での解決能力を持てるようになる」で、作ったモデルそのものや短期的な商売に対して何か期待があるわけではないです。
2024-04-20 16:41:40日本の正しい知識をもっと学習したい LLMが普及したら、日本に関する質問も増えるはず たとえば私はレトロゲームに関する質問をしてるけど 日本語LLMと英語LLMでは回答の知識が違う なぜなら国によって当時遊べたゲームソフトが違うから 正しい知識はハレーション緩和にも役立つはず x.com/imos/status/17…
2024-04-20 16:42:21@imos LLMでVtuberのロールプレイさせようとしてる人間からすると、もっとオノマトペとか使用してくれるLLMがあればなぁと思ってます! そのような人間味が出せるようなLLMがあれば、あとはファインチューニングでキャラ付けはできると思うので!
2024-04-20 16:44:40「AI 彼女」「AI 彼氏」的な振る舞いが出来るように適切なデータセットを与えられてると、その方向でビジネスを考えている身としては嬉しいけど、俺が LLM の開発に関わってたら意図的にそれを防いだ制限モデルしか公開せず、独占してる無制限モデルを使って AI 恋人アプリをリリースするだろうな。 x.com/imos/status/17…
2024-04-20 16:44:46インテリジェンス(国防のほう)やるべき。例えば統計的に説得できそうな人を見つけて扇動するプログラムを開発したケンブリッジアナリティカがあったけどLLMが有用であればあるほどやりやすくなってるので耐扇動LLMみたいなものが必要。 x.com/imos/status/17…
2024-04-20 16:48:28「国産LLM」より、「国産データセット、ベンチマーク」の方が世界が使ってくれて良いという話にならないんかな? なぜ、「国産LLM」なんでしょ。 半導体やスマホも、日本は素材で勝ってる、LLMもデータセットやベンチマークに全振りはありちゃう?
2024-04-20 16:48:30以下あたりがあると業務利用で非常に助かります!! * 高速な日本語の処理 * ですます調、である調、体言止めなどの指定 * 「何文字以内で記載」に日本語でも対応 * 神エクセルのフォーム認識、自動記載 * 課金はチーム単位の年度払いが可能 * 課金版はサーバにデータを残さない設定が可能 x.com/imos/status/17…
2024-04-20 16:50:02@imos Chatgptなどでも見られる「それは非倫理的だから答えません」みたいな反応はないと良いですね。特にクリエイターの立場としては、あれは使いづらいので… あと、他のリプにもありましたが、日本の独特の宗教知識に詳しいとありがたいかも、というのはあります
2024-04-20 16:51:35@imos LLMに期待することとはちょっとずれてしまうかもですが、PPOやDPOに使う日本語ネイティブの嗜好データが少ないので、作成プロジェクトとか協力の枠組みがあればなと思ってます
2024-04-20 16:55:11国産LLMにやって欲しい事、他には名寄せ(東京都新宿区2丁目一番横浜1丁目ビル、みたいな文字列を適切にパースする)がある。デジタル庁のマイルストーンのひとつだから発想はあるだろうけど名寄せLLMは作れたら貢献度大きい。
2024-04-20 16:56:17Grammarlyじゃないけど、日本語のProofingがもっと高度になって、霞が関語みたいな持って回った言い方や主述はっきりしない文書がはっきりリジェクトされるようになるといいな… x.com/imos/status/17…
2024-04-20 16:59:22@imos あと、自前の文体をLoraみたいに学ばせる機能と… 設定などの固定情報が記録されて、そこは崩さずに文章生成をしてくれる機能があると助かります 長々と生成させてると、多くのLLMは忘れちゃうので…😖
2024-04-20 16:59:37@imos 短期的には両方ですが、前者は情報が上がってくる総量はコントロールできない(事実上インターネット以上に情報を集められる媒体がない)ので、人材特化でいいと思います。LLM単体だと数年すれば分野として腐るので、遠くない時期に基盤モデルや応用全般を扱う方向に進まないといけない。
2024-04-20 16:59:55