「いらすとや」は要らなくなっちゃう?テキストで説明するとそれに沿った何パターンもの画像を生成するOpenAIが凄まじい

「チュチュを着た赤ちゃん大根が犬を散歩させている」を描けるAIヤバすぎんだろ
787
小猫遊りょう(たかにゃし・りょう) @jaguring1

毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。

小猫遊りょう(たかにゃし・りょう) @jaguring1

うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた(DALL-EとCLIP)。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/wGXT6oN8Mh

2021-01-06 07:32:33
拡大
拡大
拡大
拡大
小猫遊りょう(たかにゃし・りょう) @jaguring1

1枚目:「チュチュ(バレエ衣装の一つ)を履いた赤ちゃん大根が犬を散歩させてるイラスト」というテキストを入力した時の結果 しかも,色々と文を変更することができる。「犬の散歩」を「電卓を使用」に変更したり。 pic.twitter.com/tpvUqn5WZw

2021-01-06 08:03:10
拡大
拡大

すご・・・

Аеолия 🤍💙🤍 @aeolia_s

これ、イラスト素材屋が要らなくなるな。 twitter.com/jaguring1/stat…

2021-01-06 13:13:35
sn42 @sn42neuro

画像検索してるような出来だな…。 twitter.com/jaguring1/stat…

2021-01-06 12:59:01
もずく @rxahfc4954

小説ぶち込んだら漫画として出力とかできたら面白そう twitter.com/jaguring1/stat…

2021-01-06 15:16:03
marooon9 |マローン @marooon9_

すごい。専門的な挿絵も簡単に作れてしまいそう。AIが生成したイラストの著作権ってどこにあるんだろう? twitter.com/jaguring1/stat…

2021-01-06 14:27:38
革命的技特主義 @rts_revts

@jaguring1 これって 「3×4を計算している人」って入力すると12って文字も出てくるんですか?

2021-01-06 13:19:34
小猫遊りょう(たかにゃし・りょう) @jaguring1

@QUBIT_19 とても良い着眼点だと感じます。原理的には可能だと思いますが、現時点ではまだ難しそうに感じます。それが可能なモデルを作るのも興味深い方向性の一つでしょうね。

2021-01-06 14:02:49

小猫遊りょう(たかにゃし・りょう) @jaguring1

DALL-Eは非常に幅広いテキストと画像を扱える。例えば、「人間の行動や衣服」を、「動物や食料品などの無生物」に移したときの画像を生成できることがある。赤ちゃん大根にチュチュを着せたり、犬を散歩させたり、電卓を使わせたり、車に乗らせたり、バイクに乗らせたり、ヘルメットを被らせたり。

2021-01-06 08:23:16
小猫遊りょう(たかにゃし・りょう) @jaguring1

「大根がバイクに乗る」や「大根が電卓を利用する」など、手足が必要な状況では、大根のそれっぽいところに手足っぽいのを生やしたような画像が生成されてて、興味深い

2021-01-06 08:32:58
小猫遊りょう(たかにゃし・りょう) @jaguring1

画像1枚目は、テキスト「三角形の白いテーブル」の結果。 さまざまな多角形に変更可能。画像2枚目は「四角形」に変更。 さらに、テーブルをさまざまな物に変更可能。画像3枚目は「時計」に変更。 さらに、さまざまな色に変更可能。画像4枚目は「緑」に変更。 pic.twitter.com/oh7bpFq2ep

2021-01-06 08:51:41
拡大
拡大
拡大
拡大
小猫遊りょう(たかにゃし・りょう) @jaguring1

DALL-Eは、様々な動物を様々な視点で描くことができる。 テキスト「野原に座っているカピバラの極端なクローズアップ写真」 pic.twitter.com/GJMI6AoYEB

2021-01-06 09:11:52
拡大
小猫遊りょう(たかにゃし・りょう) @jaguring1

1枚目は「野原に座るワシ(鷲)のボクセル」 2枚目は鷲をカピバラに変更。ボクセルから3d renderに変更。 3枚目はカピバラのX線写真っぽい画像(実際とは異なるが,それっぽくみえる。 4枚目は、「カピバラ」と「ボクセル」の組み合わせ。 pic.twitter.com/Kgo3PoGnIX

2021-01-06 09:29:45
拡大
拡大
拡大
拡大
小猫遊りょう(たかにゃし・りょう) @jaguring1

マネキンに色々な服を着せられる pic.twitter.com/F2lKMIwsEA

2021-01-06 09:52:59
拡大
拡大
拡大
拡大
小猫遊りょう(たかにゃし・りょう) @jaguring1

テキストから画像を生成する技術の進歩。 1枚目:2015年11月(止まれ標識が青空のなかで飛んでいる) 2枚目:2021年1月(パンダの赤ちゃんがチュチュを着て犬を散歩させているイラスト) pic.twitter.com/vIMY26Tsd9

2021-01-06 14:38:37
拡大
拡大

小猫遊りょう(たかにゃし・りょう) @jaguring1

OpenAIの有名な研究者が少し前に言っていたこと。 twitter.com/jaguring1/stat…

2021-01-06 09:02:30
小猫遊りょう(たかにゃし・りょう) @jaguring1

GPT-3開発に関わったIlyaの主張が載ってる blog.deeplearning.ai/blog/the-batch… 『2020年は、汎用モデルが経済的に有用なものになった最初の年だった。大規模言語モデルが驚くほどの言語能力を持ち、幅広い有用なタスクを実行できることを実証した』 『2021年、言語モデルは視覚的な世界を認識し始めるでしょう』

2021-01-02 06:40:24
小猫遊りょう(たかにゃし・りょう) @jaguring1

GPT-3開発に関わったIlyaの主張が載ってる blog.deeplearning.ai/blog/the-batch… 『2020年は、汎用モデルが経済的に有用なものになった最初の年だった。大規模言語モデルが驚くほどの言語能力を持ち、幅広い有用なタスクを実行できることを実証した』 『2021年、言語モデルは視覚的な世界を認識し始めるでしょう』

2021-01-02 06:40:24