ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

如果你之前在用 ChatGPT 生成含有中文字的圖片,卻老是覺得字體怪怪的、排版也不夠精準,這次 OpenAI 正式推出的 ChatGPT Images 2.0,應該會讓你眼睛一亮。根據官網的介紹,這次升級不只解決了長久以來的中文渲染問題,還首度加入了「思考模式」,讓圖像生成從單純的「照你說的畫」,進化成「幫你想清楚再畫」。官方公告可以在這裡找到:https://openai.com/index/introducing-chatgpt-images-2-0/,有興趣的讀者可以直接去看看。更值得一提的是,這款新模型免費用戶也能使用,算是一次非常有誠意的更新。

要了解這次 Images 2.0 有多重要,得先知道 ChatGPT 在圖像生成這塊走過的路。過去很長一段時間,ChatGPT 主要依賴 DALL-E 系列模型生圖,但在處理中文、日文、韓文這類非拉丁字母語言時,表現一直差強人意,偶爾還會生出看起來像中文、但其實是亂碼的文字。去年底 OpenAI 推出了 GPT-Image-1.5,在色彩和光線上有所改善,但文字渲染的問題仍未根本解決。這次 Images 2.0 的模型代號升級為 gpt-image-2,根據 OpenAI 的說法,這是從架構層面重新設計的新一代模型,不是小修小補,而是一次真正意義上的世代交替。

🔔 不錯過任何精彩! 立即訂閱我們的 LINE 官方帳號

每次發佈新文章時,您將會第一時間收到本站文章連結通知,輕鬆掌握最新資訊!

§相關文章,還可以參閱:

中文字終於不再「假裝」了:文字渲染大幅進化

對台灣用戶來說,這次最直接的感受就是中文字終於「真的是中文了」。根據官網的介紹,Images 2.0 針對非拉丁語系做了重點優化,包含繁體中文、日文、韓文、印地文和孟加拉文,都有顯著進步。這不只是翻譯準確而已,而是讓文字在圖片裡的呈現方式也更符合該語言的視覺習慣,讀起來流暢自然,不再有那種明顯「外國人寫中文字」的違和感。下方這張圖就是用 ChatGPT Images 2.0 生成的美伊戰爭資訊圖表,中文標註清晰、排版層次分明,你可以自己感受一下這個進步有多明顯。

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

除了語言本身,這次在密集文字的處理上也進步很多,像是 UI 畫面截圖、資訊圖表、海報設計這類需要塞很多小字的應用場景,過去很容易出現文字變形或缺字的問題,現在幾乎都能正確呈現。解析度方面也同步升級,最高支援 2K 輸出,畫面清晰度比前代提升不少,拿來做印刷品或大圖輸出也沒問題。

「思考模式」是什麼?這才是這次最大的突破

這次 Images 2.0 最讓人興奮的新功能,是「思考模式(Thinking)」。簡單來說,過去的圖像生成是即時反應型的,你說什麼它就畫什麼,好壞全看你的提示詞寫得夠不夠清楚。但思考模式不一樣,它會先分析你的需求、規劃版面配置,必要時還會主動上網搜尋最新資料,確認內容正確後再動手生圖,最後還會自我檢查成品,如果不滿意會回頭修正。這個流程聽起來很像有個設計師在幫你把關,而不只是一個「照單全收」的執行工具。

對創作者或內容製作者來說,這個模式特別有用,尤其是需要角色或物件保持一致的場景,像是連續分鏡、漫畫、品牌視覺等。Images 2.0 支援一次輸出最多 8 張圖,並在這 8 張之間維持角色外型、配色、風格的連貫性,不用擔心每張圖的主角長得不一樣。下方這張降龍十八掌主題的圖就是使用思考模式生成的,你可以感受一下它對複雜武俠場景的理解與詮釋。

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

版面設計與長寬比:這次真的很靈活

除了文字和思考能力,這次在版面彈性上也有很大進步。Images 2.0 支援更廣泛的長寬比設定,從 3:1 的超寬橫幅,到 1:3 的直式長圖都能生成,不管是電腦桌布、手機直式封面、社群貼文還是長條形資訊圖表,一個工具全搞定。在物件擺放和版面配置上,這次也更精準,能做出有層次、有留白感的排版,而不只是把元素隨機堆在一起。下方這張以清明上河圖風格為靈感、加入毛筆字體七言絕句的圖片,就是在測試 Images 2.0 對傳統繪畫美學和書法字體的理解與融合能力,結果相當令人驚豔。

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

哪些人最適合用 ChatGPT Images 2.0?

這次的升級對幾類用戶特別有感。對內容創作者來說,能生成帶有正確繁體中文的資訊圖表、社群貼圖或宣傳海報,是非常實用的功能,不用再為了一張中文圖片另外找設計軟體。對教育工作者或自媒體創作者而言,一次生成 8 張風格一致的連環圖或教學圖解,效率大幅提升。對品牌設計或行銷人員來說,思考模式能自動上網查資料確保內容正確,減少因錯誤資訊而需要重來的時間。就算是一般用戶,想生成有中文字的個人化圖片、貼圖或創意圖像,這次的升級也讓門檻低了很多。

免費用戶能用嗎?各方案功能對比

根據官網的介紹,這次開放方式分為兩個層級,整理如下:

功能 免費用戶 Plus/Pro/Business
Images 2.0 即時模式(Instant) ✅ 可用 ✅ 可用
Images 2.0 思考模式(Thinking) ❌ 不支援 ✅ 可用
最高解析度 一般 最高 2K(API 可達 4K)
一次最多輸出張數 有限制 最多 8 張
API 存取(gpt-image-2) ✅(開發者方案)

簡單說,免費用戶可以直接體驗到中文渲染提升和新版模型的基本生圖能力,但想要思考模式、高解析度或一次大量生圖,就需要付費方案。對大多數一般使用者來說,免費版已經夠用了。

怎麼開始用?操作步驟很簡單

ChatGPT Images 2.0 已經直接整合進 ChatGPT 的對話介面,不需要額外安裝或設定,操作步驟如下:

  1. 前往 chatgpt.com 或開啟 ChatGPT 手機 App,登入你的帳號(免費帳號即可)。
  2. 在對話框直接輸入你想生成的圖片描述,例如:「幫我生成一張繁體中文的台灣美食資訊圖表,風格現代簡潔」。
  3. 若想使用思考模式(需付費方案),可以在提示詞裡加上「請用思考模式生成」或在介面選擇 Thinking 選項。
  4. 也可以從左側側邊欄進入「Images」專屬頁面,裡面有預設濾鏡和熱門提示詞可以快速套用,適合還不知道要怎麼下提示詞的新手。
  5. 圖片生成後,點選圖片可以進入編輯模式,直接在對話框說你想修改哪裡,系統會只改你指定的部分,不影響其他細節。
  6. 生成的圖片會自動儲存到「Images」頁籤,方便日後隨時回來查看或重新使用。

以下圖片來自:Introducing ChatGPT Images 2.0

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

ChatGPT Images 2.0 來了!會思考、能上網、中文渲染大升級,免費用戶也能用

這次真的值得試試看

整體來看,ChatGPT Images 2.0 這次的升級方向非常務實,直接針對過去最被詬病的幾個問題下手,中文渲染、版面排版、物件一致性,每一項都有看得到的改善。思考模式的加入,更是讓圖像生成從「工具」升級為「協作夥伴」的重要一步,對需要大量生成內容的創作者來說,這個價值不容小覷。實際上,如果你之前因為中文顯示問題而放棄用 ChatGPT 生圖,現在是一個很好的時機重新試試看。而對已經在用的讀者來說,這次升級帶來的提升會讓你驚訝原來 AI 生圖可以做到這個程度。