ChatGPTがついに画像を理解してミーム画像やアートの解説も可能に！評論家がいらない時代はもうすぐかも (2ページ目)

GPT-4Vに今年の阪神の優勝時の写真を与えて撮られた場所と状況を推測させたら、画像の要素を細かく分析し、知識ベースにある過去事象を組み合わせて完璧に当ててきた。こやつできるな。ちなみにGPT-4Vは2022年の知識までなので、今年優勝したことは知らない。 pic.twitter.com/6kfZRo1GyI

2023-09-27 20:34:24

拡大

拡大

深津貴之 / THE GUILD / note @fladdict

AIとイラスト界が和解する未来を期待したい。こういう勉強法がもうすぐ現実になる。自動生成だけでなく、「上達するためのツール」としてのAIに期待してる。 pic.twitter.com/5MIY14IvJP

2023-09-28 09:07:37

拡大

拡大

Hironobu Takagi / 高木啓伸 @hirotakagi

昨日、ChatGPTが画像入力対応したので「視覚障害者のためにこの画像を説明してください」というプロンプトで試しています。結論：アクセシビリティの時代が変わる！生成例↓ 画像は、晴れた空の下の現代的な都市環境を示しています。最前面には、白い文字で「Miraikan」と書かれた目立つ青い看板があります。このロゴは、線で区切られたスタイル化された地球儀から成っています。上向きの矢印と「P」の文字は駐車場の方向を示しており、「100M」はこの場所からの駐車場の距離を示唆しています。看板の背後には、ガラスと金属を主に使用した大きな現代的な建物があります。この建物は円筒形のデザインで、ファサードには格子状のパターンがあります。水平のラインで区切られた複数の階が見え、各階には窓がたくさん並んでおり、建物の内部が部分的に見えます。この構造は、看板で参照されている「Miraikan」である可能性が高いです。左側には、青みがかったファサードとユニークな建築的特徴を持つ別の建物が見えます。その建物には中央に開口部や隙間があり、一方から他方への視覚的な継続性が保たれています。建物に続く地面はテクスチャーのある表面で舗装されています。左側には、数本の茂った木々が現代的な都市の風景に緑のタッチを加えています。全体として、この画像は現代的な都市エリアの風景を示しており、その目立つ看板から「Miraikan」という施設の入口や近隣である可能性が高いです。その施設は、博物館や教育機関である可能性が考えられます。

2023-09-27 08:19:48

拡大

Benjamin Breen @ResObscura

@emollick @fakehistoryhunt Yes, working on a post about it now, but with standard GPT-4 on OCRd text from Google books (don’t have access to multimodal GPT-4 yet, it seems). Out of curiosity, could you see how it does with this from Robert Boyle’s manuscripts? Bing struggled to decipher it. pic.twitter.com/RHq1wzGu68

2023-09-28 01:47:20