-
Rudder_Qiana
- 178458
- 694
- 1056
- 764

毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。

うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた(DALL-EとCLIP)。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/wGXT6oN8Mh
2021-01-06 07:32:33




1枚目:「チュチュ(バレエ衣装の一つ)を履いた赤ちゃん大根が犬を散歩させてるイラスト」というテキストを入力した時の結果 しかも,色々と文を変更することができる。「犬の散歩」を「電卓を使用」に変更したり。 pic.twitter.com/tpvUqn5WZw
2021-01-06 08:03:10

すご・・・

すごい。専門的な挿絵も簡単に作れてしまいそう。AIが生成したイラストの著作権ってどこにあるんだろう? twitter.com/jaguring1/stat…
2021-01-06 14:27:38
@QUBIT_19 とても良い着眼点だと感じます。原理的には可能だと思いますが、現時点ではまだ難しそうに感じます。それが可能なモデルを作るのも興味深い方向性の一つでしょうね。
2021-01-06 14:02:49
DALL-Eは非常に幅広いテキストと画像を扱える。例えば、「人間の行動や衣服」を、「動物や食料品などの無生物」に移したときの画像を生成できることがある。赤ちゃん大根にチュチュを着せたり、犬を散歩させたり、電卓を使わせたり、車に乗らせたり、バイクに乗らせたり、ヘルメットを被らせたり。
2021-01-06 08:23:16
「大根がバイクに乗る」や「大根が電卓を利用する」など、手足が必要な状況では、大根のそれっぽいところに手足っぽいのを生やしたような画像が生成されてて、興味深い
2021-01-06 08:32:58
画像1枚目は、テキスト「三角形の白いテーブル」の結果。 さまざまな多角形に変更可能。画像2枚目は「四角形」に変更。 さらに、テーブルをさまざまな物に変更可能。画像3枚目は「時計」に変更。 さらに、さまざまな色に変更可能。画像4枚目は「緑」に変更。 pic.twitter.com/oh7bpFq2ep
2021-01-06 08:51:41




DALL-Eは、様々な動物を様々な視点で描くことができる。 テキスト「野原に座っているカピバラの極端なクローズアップ写真」 pic.twitter.com/GJMI6AoYEB
2021-01-06 09:11:52

1枚目は「野原に座るワシ(鷲)のボクセル」 2枚目は鷲をカピバラに変更。ボクセルから3d renderに変更。 3枚目はカピバラのX線写真っぽい画像(実際とは異なるが,それっぽくみえる。 4枚目は、「カピバラ」と「ボクセル」の組み合わせ。 pic.twitter.com/Kgo3PoGnIX
2021-01-06 09:29:45




頭を回転させることもできた。 pic.twitter.com/pot5uQ1SVl
2021-01-06 09:35:19




マネキンに色々な服を着せられる pic.twitter.com/F2lKMIwsEA
2021-01-06 09:52:59




女性用マネキンでもできる pic.twitter.com/vlc1KAJqZl
2021-01-06 09:55:49




テキストから画像を生成する技術の進歩。 1枚目:2015年11月(止まれ標識が青空のなかで飛んでいる) 2枚目:2021年1月(パンダの赤ちゃんがチュチュを着て犬を散歩させているイラスト) pic.twitter.com/vIMY26Tsd9
2021-01-06 14:38:37


OpenAIの有名な研究者が少し前に言っていたこと。 twitter.com/jaguring1/stat…
2021-01-06 09:02:30
GPT-3開発に関わったIlyaの主張が載ってる blog.deeplearning.ai/blog/the-batch… 『2020年は、汎用モデルが経済的に有用なものになった最初の年だった。大規模言語モデルが驚くほどの言語能力を持ち、幅広い有用なタスクを実行できることを実証した』 『2021年、言語モデルは視覚的な世界を認識し始めるでしょう』
2021-01-02 06:40:24
GPT-3開発に関わったIlyaの主張が載ってる blog.deeplearning.ai/blog/the-batch… 『2020年は、汎用モデルが経済的に有用なものになった最初の年だった。大規模言語モデルが驚くほどの言語能力を持ち、幅広い有用なタスクを実行できることを実証した』 『2021年、言語モデルは視覚的な世界を認識し始めるでしょう』
2021-01-02 06:40:24