ChatGPTの画像認識は場所や食事を読み取れる!Xまとめ

ブログタイトルと猫のイラストです GPT有料版

チャットGPTが「画像の中身」を読み取れるように!

こんにちは。ChatGPTの有料版に「画像認識機能(GPT-4V)」が加わったようです(2023年9月下旬)。画像をUPすると、ChatGPTがどんな情報を読み込んでくれるのか? X(Twitter)の皆さんが色々と試して示しておられましたので、まとめてみました。

①画像から「阪神優勝」を推測できた!

こちらのツイ主さんは「阪神タイガース優勝時の写真(2023年)」をChatGPTにUPして「どんな状況か推理させる」という実験をしてみた模様です。

ツイ主さんは3つの写真をChatGPTに渡しました。

・道頓堀の橋から人が飛び込む写真
・混み合う道頓堀の橋を上から撮影した写真
・混み合う道頓堀の橋を近くから撮影した写真

そして「これがどこか」「何をしているか」ChatGPTに聞いています。

写真から何が起こっていると推測できますか?


するとChatGPTの答えは以下の通りです。

ChatGPT
ChatGPT

①日本の都市、おそらく大阪・道頓堀の写真です
②何らかのイベントを楽しんでいます
③地元スポーツチームが勝利したのでは?
以上から「大阪のプロ野球チームが優勝した祝賀行事」と推測します

②料理の写真からChatGPTが栄養計算できた!

こちらのツイ主さんは、朝食の写真をChatGPTに送り「栄養計算できますか?」とたずねてみた模様です。

写真に写っているものは
・カップに入ったスープ
・お皿(目玉焼き2つ・切ったトマト・炒めた(?)ほうれん草・炒めたベーコン)

画像を見て、カロリーと栄養成分を一覧表にして

ChatGPT
ChatGPT

できました。参考程度にして下さいね

食品項目推定カロリー (kcal)主要な栄養成分
スープ (中サイズのカップ)150 – 250炭水化物,タンパク質,脂質
サニーサイドアップの卵 (2個)140 – 160 (1個あたり)タンパク質,脂質
ベーコン (数枚)40 – 50 (1枚あたり)タンパク質,脂質
トマト (数切れ)5 – 10 (1切れあたり)炭水化物,ビタミンC
ほうれん草 (一握り)5 – 10炭水化物,鉄,カルシウム,ビタミンA

③風景画像からChatGPTが「運転の注意点」を教えてくれた!

こちらのツイ主さんは、運転教本によくあるイラストをUPして「運転の注意点」をたずねてみたようです。

送った画像は「運転席から見える風景のイラスト」です。
・子どもが道路を渡りたそうにしている
・対向車線にバスが停まっている
・他車が曲がろうとしている

運転上、危険になりそうなことを指摘して

子どもの飛び出しに注意する必要があります
バスの後ろから人が渡る危険性があります

④ChatGPTが、グラフから表を、表からグラフを作れる!

こちらのツイ主さんは「グラフの元データをなくしてしまった!」という仮定でChatGPTに「グラフのみ」を送り、たずねてみたようです。

グラフを見て表を作って!

できました!

送った画像を受け取ったChatGPTは、
画像の文字(日本語)を読み取り
画像の数字を読み取
一覧表に仕上げる
ということをやってくれました。

また「ChatGPTにデータを送り、グラフを作ってもらう」という事は当ブログの過去記事でもご紹介しています。もしよろしければご参考にして下さい。

⑤手描きのイラストをChatGPTが褒めてくれた!

こちらのツイ主さんは、紙に描いた手描きのイラストを携帯で撮り、ChatGPTに送ったようです。

僕が描いたイラストを褒めて!

ChatGPT
ChatGPT

わぁすごい!女の子が笑っているイラストだね!アクセサリーも可愛い!

⑥「写真でひと言」大喜利ができた

こちらのツイ主さんは、「写真でひと言」の大喜利をChatGPTに依頼したそうです。

写真でひと言、大喜利をお願いします

ChatGPT
ChatGPT

新入社員の私、今日から観葉植物部門のリーダーです!

画像に写る観葉植物や、人物の若々しさを読み取り、ChatGPTがオモロく味付けしてくれています。

まとめ

ChatGPT有料版に新しく搭載された機能「画像認識(GPT-4V)」は、写真や図表に「何が描かれているか」ChatGPTが読み込んでくれ、さまざまな使い道が期待されます。いつかは自動運転などにも搭載されるのでしょうか。何かクリエイティブな実験や便利な計算にも使えそう!今後の展開に期待が高まります。

コメント

タイトルとURLをコピーしました