DALLE-2が独自言語を獲得!?

16
Giannis Daras @giannis_daras

Our gibberish tokens have varying degrees of robustness in combinations with contexts. E.g. if xx produces birds, ‘xx flying’ is an easy prompt ‘xx on a table’ is a neutral prompt, and ‘xx in space’ is a hard prompt. (8/N)

2022-06-03 15:09:35
Giannis Daras @giannis_daras

Our hidden vocabulary seems robust in easy and sometimes neutral prompts but not in hard ones. These tokens may produce low confidence in the generator and small perturbations move it in random directions. "vicootes" means vegetables in some contexts and not in others. (9/N) pic.twitter.com/r2s5I6Bnp0

2022-06-03 15:09:37
拡大
Giannis Daras @giannis_daras

We want to emphasize that this is an adversarial attack and hence does not need to work all the time. If a system behaves in an unpredictable way, even if that happens 1/10 times, that is still a massive security and interpretability issue, worth understanding. (10/N, N=10).

2022-06-03 15:09:37
Giannis Daras @giannis_daras

@benjamin_hilton, @realmeatyhuman, @BarneyFlames, @mattgroh, @rctatman, @Plinz, @Thomas_Woodside hopefully some of your concerns are addressed! Let us know what you think. We will update the pre-print with this discussion: arxiv.org/abs/2206.00169

2022-06-03 15:09:38

論文の著者の1人

Alex Dimakis @AlexGDimakis

My student Giannis discovered that DALLE2 has a secret language. This can be used to crate absurd prompts that generate images. E.g. ''Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons'' generates Birds eating Bugs! We wrote a short paper on our experiments. twitter.com/giannis_daras/…

2022-06-01 02:47:43
Giannis Daras @giannis_daras

DALLE-2 has a secret language. "Apoploe vesrreaitais" means birds. "Contarra ccetnxniams luryca tanniounons" means bugs or pests. The prompt: "Apoploe vesrreaitais eating Contarra ccetnxniams luryca tanniounons" gives images of birds eating bugs. A thread (1/n)🧵 pic.twitter.com/VzWfsCFnZo

2022-06-01 02:44:25

OpenAIの代表による反応

Greg Brockman @gdb

Turns out DALL-E can read the seemingly gibberish writing it produces. Built its own mini-language that is consistent between its text input space and image output space: twitter.com/giannis_daras/…

2022-06-01 09:07:50
Greg Brockman @gdb

A pretty good hypothesis on how this arises (as an artifact of how the text input space is tokenized): twitter.com/BarneyFlames/s…

2022-06-01 09:11:49
Aperiodic Tile @BarneyFlames

I took a look at the BPE encoding of the name DALL-E uses for birds. Its "apo, plo, e</w>, ,ve, sr, re, ait, ais</w>". Apo-didae & Plo-ceidae are families of birds, each with 100+ species. Apo-diformes is the biggest order of birds with 400+ species of birds. twitter.com/giannis_daras/…

2022-06-01 05:37:44

その他外部サイト

ai-scholar

リンク AI-SCHOLAR | AI:(人工知能)論文・技術情報メディア DALLE-2が独自言語を獲得!? 3つの要点✔️ DALL·E2が扱う独自言語をブラックボックス方式で調査✔️ 独自言語としての一貫性に疑問✔️ モデルの解釈性とセキュリティに課題Discovering the Hidden Vocabulary of DALLE-2written&nbsp;by&nbsp;Giannis Daras,&nbsp;Alexandros G. Dimakis(Submitted on 1 Jun 2022)Comments: Published on arxiv.Subjects: Machine Lear 3 users 14

ITmedia

リンク ITmedia NEWS 画像生成AIが独自の“AI語”を生み出した? 「DALL-E 2」を巡って、米テキサス大学が論文発表 AIが人間の言葉ではない独自の言語を生成した──米テキサス大学の研究チームはそのような研究結果を示す論文を発表した。画像生成AIが生み出す文字列は意味不明なものであると思われていたが、それらの言葉は鳥や野菜などの意味を持つ“AI語”であったという。 41 users 32

gigazine

反論のまとめもあり

リンク GIGAZINE AI画像ジェネレーター「DALL・E 2」は独自の「秘密言語」を持っているか? 自然言語処理と画像生成を組み合わせたAI画像ジェネレーター「DALL・E 2」で、人間からすると意味のない文字列を入力したときに似たような画像が生成されることがあるため「秘密の言語がある」と研究者が指摘しました。 8 users 13

GClue

リンク www.gclue.jp DALL-E2が秘密の言語をもっているという話を検証してみた アプリ, クラウド, AI, IOT, RoboticsでDX化を加速 2 users 2