“AI生成の文章/画像だけ”でデータを学習する手法 人間が作るものは一切使わずそれでも既存モデルの同等以上の性能。 GoogleとMITが開発

AI
6
ITmedia NEWS @itmedia_news

ITニュースサイト「ITmedia NEWS」です。ニュースをめぐるあれやこれやを編集部からお届けします。記事更新情報は自社開発botが、編集部からのお知らせなどは手動で投稿しています。

itmedia.co.jp/news/

ITmedia NEWS @itmedia_news

“AI生成の文章/画像だけ”でデータを学習する手法 人間が作るものは一切使わず GoogleとMITが開発 itmedia.co.jp/news/articles/…

2024-01-16 08:05:04
Noma @kondomasaomi3

@itmedia_news 凄い!これからはAIだけで進化し続けるのか

2024-01-16 17:24:33
Seamless @shiropen2

“AI生成の文章/画像だけ”でデータを学習する手法 人間が作るものは一切使わず GoogleとMITが開発 itmedia.co.jp/news/articles/… 生成AIが作成した合成テキストと合成画像のみから視覚AIモデルを学習する手法。人の介入したデータは不使用。それでも既存モデルの同等以上の性能。

2024-01-16 09:13:12
特許生成&調査をAIで!/TokkyoAi平井 @yutori_JD

「SynCLRは、実世界のデータを直接観察することなく、効果的な視覚的理解を発達させられる」 twitter.com/itmedia_news/s…

2024-01-16 08:56:59
skt @melodicramen

AIが生成した画像で学習したから権利問題解決!という論文だと勘違いされてキレられてるのか 本当に全くそんな事書いてないな twitter.com/itmedia_news/s…

2024-01-17 22:30:39
Yuya Hanai @hanasaan_

こちらの論文、元から学習データの権利問題は一切気にしておらず「AI生成物だけから識別AIは学習できるし、何なら性能もいいぞ!」だけが主張なんですよね。見出し一つで「学習をクリーンにすること」が目的と誤解され、かつそれが未達成と批判されるの興味深いですね。(続 twitter.com/itmedia_news/s…

2024-01-17 10:07:57
Yuya Hanai @hanasaan_

この論文のモチベは「整理済み大規模データセットを安く作りたい」なので、論文要旨の"without any real data"に内包された文脈はデータの権利問題ではなく、アノテーションコストを表してます。ところがこれを「人間が作るものは一切使わず」と訳してしまうと権利問題の文脈に見えてしまう。(続

2024-01-17 10:07:57
Yuya Hanai @hanasaan_

なので「実データ不使用」と直訳したほうが、まだ誤解は減らせたかも。見出しにするなら「生成AIで大規模データセット作成コスト低減へ」くらいでしょうかね。この手法は、結局元の生成モデルの品質に大きく依存しているので、美しさはあんまない気がします。個人的にはやっぱりFDSL推しです。

2024-01-17 10:07:57
ステスロス@創作/画像生成AI/雑学RT @StelsRay

大変興味深い 一昨年くらいまでは機械学習のデータにAI生成物を使用すると最終的には破綻すると言われていたものだけど その壁を乗り越えたか! twitter.com/shiropen2/stat…

2024-01-16 10:16:37
Cognac @Cognac5289

AIの学習データまわりは時間がかかるので良い解決策になるかも? twitter.com/shiropen2/stat…

2024-01-16 12:01:53
Katsuo in the sky @KasuointheSky

いやいやいや…! 合成画像使っているし、本当に画像を使わない技術だったら既にあるんだって…! それも日本発の! このnoteを読んで欲しい…こっちの方が凄いでしょうに… note.com/katsuo_inthesk… どうして日本の技術だと記事にして驚いてくれないのか… twitter.com/itmedia_news/s…

2024-01-16 23:56:34
Simon.Zh @TakuShinmin

まぁ、5年後にこれが主流になるだろうな twitter.com/itmedia_news/s…

2024-01-16 08:42:42
Saki | 読書と数理科学 @Saki_reset

LLMは大量のデータから帰納的推論をしているだけだから、演繹的に論理を積み上げる数学は絶対に出来ないと思っていた。しかし、つい最近、「LLMと演繹エンジンとの組み合わせ」で、数オリの幾何の問題を金メダリスト同等の精度で解くモデルが発表されて、もう物理世界に複雑に干渉する仕事(外科医など)か、真に革新的な知識を生み出す研究だけが、人間に残された役割になっていくのかもしれないなと思った

2024-01-19 20:02:06
拡大
まずみろ⚜️UT @mazmiro1

@Saki_reset 未解決の数学の問題をAIが証明解決したって、ここ1ヶ月以内に見た気がする

2024-01-19 21:07:07