💡 什麼是「AI 看圖」? 2024 年起,主流 AI 都支援「上傳圖片」功能。你可以拍一張照片丟給 AI,它能辨識內容、回答問題、甚至提供建議。這就是多模態 AI 的實際應用。
🔥 10 個最實用的「看圖」場景
1. 辨識植物 / 動物 🌿
拍下路邊的花或樹,問 AI:
這是什麼植物?有毒嗎?怎麼照顧?
2. 翻譯外文菜單 🍜
出國旅遊看不懂菜單?拍一張照片:
請翻譯這份菜單,並推薦 3 道適合不吃辣的人的菜。
3. 解數學題 📐
拍下數學課本或考卷:
請解這道題,並用最白話的方式解釋每一步。
4. 分析圖表 📊
拍下簡報裡的圖表:
這張圖表說了什麼?有沒有什麼值得注意的趨勢?幫我寫一段分析。
5. 辨識錯誤 🐛
程式跑出錯誤訊息?截圖丟給 AI:
這個錯誤是什麼意思?怎麼修?
6. 穿搭建議 👔
拍下今天的穿著:
這套搭配怎麼樣?如果要去正式的商務午餐,需要調整什麼?
7. 食品營養分析 🏷️
拍下食品背面的營養標示:
這個食品健不健康?我正在減醣,適合吃嗎?
8. 家具 / 商品辨識 🪑
看到喜歡的家具但不知道品牌:
這是什麼風格的椅子?哪裡可以買到類似的?大概多少錢?
9. 手寫筆記數位化 ✍️
拍下手寫的會議筆記:
幫我把這些手寫內容轉成數位文字,並整理成條列式重點。
10. 維修診斷 🔧
拍下壞掉的東西:
我的洗衣機出現這個符號,是什麼意思?我能自己修嗎?
🛠️ 各工具的圖片能力比較
| 功能 | ChatGPT (GPT-4o) | Claude | Gemini |
|---|---|---|---|
| 上傳圖片 | ✅ | ✅ | ✅ |
| 圖片中的文字辨識 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 圖表分析 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 物體辨識 | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 手寫辨識 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 免費使用 | ✅(有限額) | ✅(有限額) | ✅(完全免費) |
| 手機 App | ✅ | ✅ | ✅ |
💡 推薦: 日常看圖用 Gemini(完全免費 + 辨識能力強),需要深度分析用 ChatGPT。
📱 怎麼上傳圖片?
手機(最方便)
- 打開 ChatGPT / Claude / Gemini 的手機 App
- 點對話框旁的「+」或「📎」按鈕
- 選擇「拍照」或「從相簿選取」
- 上傳後打字問問題
電腦
- 在對話框找到附件按鈕(📎 或 +)
- 拖拉圖片到對話框
- 或直接 Ctrl+V 貼上截圖
⚡ 讓 AI 看圖看得更準的技巧
拍清楚
- 確保圖片不模糊、不反光
- 文字類的照片盡量正面拍,不要歪斜
- 光線充足很重要
問具體
❌ 「這是什麼?」 ✅ 「這張照片裡的紅色花是什麼品種?適合種在台灣嗎?」
提供背景
❌ 「幫我分析這張圖」 ✅ 「這是我公司上一季的銷售數據圖。請分析哪個產品線成長最快,以及可能的原因。」
一次一張
上傳太多張圖片反而會降低分析品質。一次一張、一個問題,效果最好。
⚠️ 注意事項
- 不要上傳包含個人敏感資訊的圖片(身分證、銀行卡、密碼)
- AI 辨識植物/動物的準確率約 80-90%,重要判斷(如有毒植物)請再查專業資料
- 醫療相關的圖片(如皮膚狀況)只能做初步參考,不能取代就醫
常見問題
AI 看得懂中文手寫字嗎?
可以!主流 AI 的中文手寫辨識能力已經很好。但如果字太潦草,準確率會下降。建議拍清楚、字寫大一點。
可以上傳 PDF 或文件嗎?
ChatGPT 和 Claude 都支援直接上傳 PDF。如果你要處理大量文件,推薦用 NotebookLM,它專門為文件分析設計。
AI 會保存我上傳的圖片嗎?
依各家政策而定。ChatGPT 在「不訓練模式」下不會用你的圖片來訓練。Claude 預設不保存。建議敏感圖片不要上傳到任何 AI 工具。