ChatGPTがついに画像を理解してミーム画像やアートの解説も可能に!評論家がいらない時代はもうすぐかも

海外ミームって意味わからん場合多いから普通に助かる
30
FabyΔ @FABYMETAL4

GPT-4Vに今年の阪神の優勝時の写真を与えて撮られた場所と状況を推測させたら、画像の要素を細かく分析し、知識ベースにある過去事象を組み合わせて完璧に当ててきた。こやつできるな。 ちなみにGPT-4Vは2022年の知識までなので、今年優勝したことは知らない。 pic.twitter.com/6kfZRo1GyI

2023-09-27 20:34:24
拡大
拡大
深津 貴之 / THE GUILD / note @fladdict

AIとイラスト界が和解する未来を期待したい。こういう勉強法がもうすぐ現実になる。 自動生成だけでなく、「上達するためのツール」としてのAIに期待してる。 pic.twitter.com/5MIY14IvJP

2023-09-28 09:07:37
拡大
拡大
Hironobu Takagi / 高木 啓伸 @hirotakagi

昨日、ChatGPTが画像入力対応したので「視覚障害者のためにこの画像を説明してください」というプロンプトで試しています。 結論:アクセシビリティの時代が変わる! 生成例↓ 画像は、晴れた空の下の現代的な都市環境を示しています。最前面には、白い文字で「Miraikan」と書かれた目立つ青い看板があります。このロゴは、線で区切られたスタイル化された地球儀から成っています。上向きの矢印と「P」の文字は駐車場の方向を示しており、「100M」はこの場所からの駐車場の距離を示唆しています。 看板の背後には、ガラスと金属を主に使用した大きな現代的な建物があります。この建物は円筒形のデザインで、ファサードには格子状のパターンがあります。水平のラインで区切られた複数の階が見え、各階には窓がたくさん並んでおり、建物の内部が部分的に見えます。この構造は、看板で参照されている「Miraikan」である可能性が高いです。 左側には、青みがかったファサードとユニークな建築的特徴を持つ別の建物が見えます。その建物には中央に開口部や隙間があり、一方から他方への視覚的な継続性が保たれています。 建物に続く地面はテクスチャーのある表面で舗装されています。左側には、数本の茂った木々が現代的な都市の風景に緑のタッチを加えています。 全体として、この画像は現代的な都市エリアの風景を示しており、その目立つ看板から「Miraikan」という施設の入口や近隣である可能性が高いです。その施設は、博物館や教育機関である可能性が考えられます。

2023-09-27 08:19:48
拡大
Benjamin Breen @ResObscura

@emollick @fakehistoryhunt Yes, working on a post about it now, but with standard GPT-4 on OCRd text from Google books (don’t have access to multimodal GPT-4 yet, it seems). Out of curiosity, could you see how it does with this from Robert Boyle’s manuscripts? Bing struggled to decipher it. pic.twitter.com/RHq1wzGu68

2023-09-28 01:47:20
拡大
Peter Yang @petergyang

I will never get a parking ticket again. pic.twitter.com/yl7ND2rJeQ

2023-09-28 08:05:47
拡大
すぐる👨‍💻早稲田AI研究会幹事 @AIomoshiro

GPT-4Vに有名錯覚画像を判定させてみる ムキムキーヌ:正解✅ 釣り小人:正解✅ pic.twitter.com/MmtAPjpo6a

2023-09-28 01:06:40
拡大
拡大
Yota Ishikawa | AI @ytiskw

17. 複数の画像の類似点を探してもらう pic.twitter.com/75PTHVS2UF

2023-09-28 13:17:56
拡大
AI𝕏サトシ🐟 @AiXsatoshi

GPT-4V 自動運転、危険予知の可能性 未来のナビにはAIアドバイザー必須かも pic.twitter.com/qcknOaxFHt

2023-09-27 16:46:44
拡大
そぞら@Raspberry Pi 電子工作 @sozoraemon

ChatGPTの新機能がすごい。抵抗の画像を投げると、カラーコードを読んで、何オームか答えてくれる。こういうアプリ、探してた人も多いはず。 pic.twitter.com/7nGW6sNBBU

2023-09-28 20:25:52
拡大
kei07224 @kei07224

ChatGPT、もしかしてチェスできる? GPT-4Vに何を学習させたのかすごく気になる。 pic.twitter.com/jYWOGSpJ25

2023-09-27 20:48:29
拡大
深津 貴之 / THE GUILD / note @fladdict

GPT-Vの分析性能、かなりすごいな。ネットにリソースがなさそうな、滅茶苦茶な画像でも解説できる。 pic.twitter.com/WHa3pb74q4

2023-09-27 21:05:13
拡大
Dory | LLM | AI Agent @dory111111

ChatGPTの画像認識ではじめる栄養管理。 食事の画像を投げると、ざっくりのカロリーを推定してくれる。 (こういうアプリ、学生の頃むちゃくちゃ作ろうとして挫折した) pic.twitter.com/Vk6lNZJgnG

2023-09-28 07:42:00
拡大