
Google 最新推出的 AI 圖片生成模型 Nano Banana 2(正式名稱:Gemini 3.1 Flash Image),這次帶來了多項令人眼睛一亮的升級,包含能夠「上網查圖再生圖」的 Visual Grounding 功能、更極端的畫面比例,以及官方親自示範的 5 個 Prompt 實用範例。對想要用 AI 生圖的創作者或開發者來說,這款模型值得認真了解一下。你可以透過 Google AI Studio 直接試用,或參考 Gemini 官方文件 了解更多技術細節。
這次 Google 在圖片生成模型的陣容裡,目前共有三款可以選擇:Nano Banana 1(NB1)、Nano Banana 2(NB2),以及旗艦級的 Nano Banana Pro。對一般用戶來說,NB2 是最值得優先嘗試的選擇,因為它擁有約 Pro 模型 95% 的能力,但價格卻只有一小部分。實際上,除非你遇到非常複雜、多層次的 Prompt 處理失敗,否則幾乎不需要特別升級到 Pro。NB1 雖然仍是速度最快、價格最低的選項,但新專案建議直接從 NB2 開始測試。
🔔 不錯過任何精彩! 立即訂閱我們的 LINE 官方帳號
每次發佈新文章時,您將會第一時間收到本站文章連結通知,輕鬆掌握最新資訊!
NB1、NB2、Pro 怎麼切換?一般用戶和開發者的方法不一樣
對一般用戶來說,在 Gemini App 裡,NB2 已經成為 Fast、Thinking、Pro 模式的預設圖片生成引擎,Google AI Pro 和 Ultra 訂閱者則可以透過三點選單的「重新生成」功能繼續使用 NB Pro。對開發者來說,三款模型各有獨立的 model ID,在 API 呼叫時指定即可切換:NB2 對應 gemini-3.1-flash-image-preview、NB Pro 對應 gemini-3-pro-image-preview、原版 NB1 則是 gemini-2.5-flash-image。此外,也可以直接在 Google AI Studio 的圖片生成模式裡,從 model selector 下拉選單選擇對應模型,操作上相當直覺。
最大亮點:Visual Grounding:AI 會先上網查圖再幫你生圖
這次 NB2 最令人驚喜的新功能,就是 Visual Grounding,模型會在生圖之前,主動上網搜尋真實圖片作為參考,再依照現實樣貌來生成畫面。這對想呈現特定地標建築、城市廣場,或是精確生物物種的用戶來說,實用性非常高。根據官網的介紹,這個功能特別適合用來生成特定地點的教堂、橋梁、冷門建築,或是某個特定品種的動物和昆蟲。不過有一點要留意:模型目前無法搜尋真實人物的圖片,這個限制在使用時需要注意。
新參數:支援 512px 與極端比例,省錢又靈活
NB2 這次新增了 512px 解析度輸出選項,生成速度更快、成本也和 NB1 差不多,非常適合開發者用來大量測試 Prompt。根據官網的介紹,最佳化的工作流程是:先用批次 API(享有 50% 折扣)大量生成 512px 的版本,挑出最滿意的構圖之後,再請 NB2 將選定圖片升級到 1K、2K 甚至 4K。此外,這次還引入了 1:8 與 1:4 的極端寬高比(支援橫式與直式),對需要製作網頁橫幅、社群滾動素材或漫畫分格版面的創作者來說,彈性大幅提升。
思考模式(Thinking Mode):預設關掉就好
NB2 和前一代一樣內建「思考模式」,也就是模型在生圖前會先推理一遍 Prompt 的意圖。不過這次新增了可以手動開關的選項,而官方的建議是預設保持關閉。實際上,開啟思考模式會增加處理時間,對一般圖片生成來說並不必要。對使用者而言,以下三種情況才值得考慮開啟:生成結果出現邏輯混亂、需要製作複雜資訊圖表,或是同時結合 Visual Grounding 與空間推理的高難度任務。
Google 親自示範的 5 個 Prompt 實用範例
這次官方提供了 5 個具體 Prompt 範例,讓用戶可以直接上手練習。對想快速掌握 NB2 風格的人來說,這些範例是最好的學習起點。
① 卡通人像(Cartoon Portrait)
把真人照片變成 3D 動畫風格角色,並讓真人與 3D 版本同框互動。需要上傳參考照片,生成結果中真人與 3D 角色姿勢、服裝、臉部特徵完全一致。
🇺🇸 原文 Prompt
Based strictly on the uploaded reference image, create a photorealistic scene featuring the real human standing next to a giant 3D animation-style version of themselves. Both must have identical facial structures, clothing, and poses. The real person is smiling naturally with their hand on the 3D character's shoulder. The 3D version is proportionally larger, anatomically identical but stylized, with expressive eyes and a playful smirk. Clean gray-blue studio background, cinematic lighting, crisp textures.
🇹🇼 中文翻譯
嚴格依照上傳的參考圖片,生成一個寫實場景:真人站在一個巨大的 3D 動畫版自己旁邊。兩者必須有相同的臉部結構、服裝與姿勢。真人自然微笑,手搭在 3D 角色的肩膀上。3D 版本比例較大,解剖結構相同但風格化,眼神生動、帶有俏皮笑容。乾淨的灰藍色攝影棚背景,電影感燈光,清晰的材質細節。
② 動畫轉實景(Animation to Image)
上傳動畫截圖,讓 AI 將卡通角色轉換成超寫實的真人場景,同時保留原本的表情、服裝與整體構圖。
🇺🇸 原文 Prompt
Convert this uploaded animated still into an ultra-realistic, cinematic, and fully photorealistic scene. Transform the animated characters into real humans while perfectly preserving their original identities, facial structures, outfits, expressions, and overall likeness.
🇹🇼 中文翻譯
將這張上傳的動畫截圖轉換成超寫實、電影感十足的全寫實場景。把動畫角色轉化為真實人物,同時完整保留原本的身份特徵、臉部結構、服裝造型、表情神態與整體外觀。
③ 歷史地圖街景(History on Maps)
模擬 Google Maps 街景風格,將歷史事件(如查理曼大帝加冕)以現代 360 度攝影機的視角重現,包含 UI 覆蓋層、廣角畸變與版權標示。
🇺🇸 原文 Prompt
Generate a hyper-realistic image of the crowning of Charlemagne on December 25, 800 AD, perfectly replicating a Google Maps Street View capture. Show Pope Leo III placing the imperial crown on a kneeling Charlemagne inside Old St. Peter's Basilica. Include a 123-degree wide-angle barrel distortion, a semi-transparent Google Maps UI overlay (navigation compass, 2D map thumbnail, white directional chevron arrows floating over the stone floor), and a 「© Google 800」 watermark. Automatically blur the faces of Charlemagne, the Pope, and surrounding medieval nobles for privacy. Use warm, dim torchlight and candlelight filtering through the basilica, dramatic shadows, and high-ISO digital noise typical of a 360-degree camera struggling in a low-light interior.
🇹🇼 中文翻譯
生成一張超寫實圖片,描繪西元 800 年 12 月 25 日查理曼大帝的加冕典禮,完美還原 Google Maps 街景拍攝風格。畫面呈現教宗利奧三世在舊聖彼得大教堂內,將皇冠戴在跪地的查理曼頭上。需包含 123 度廣角桶形畸變、半透明 Google Maps UI 覆蓋層(導航羅盤、2D 地圖縮圖、浮在石板地上的白色箭頭指示),以及「© Google 800」浮水印。自動模糊查理曼、教宗及周圍中世紀貴族的臉部以保護隱私。使用溫暖昏黃的火炬與燭光透過大教堂的光線效果、戲劇性陰影,以及 360 度相機在低光源室內拍攝時特有的高 ISO 數位雜訊。
④ 兒童蠟筆畫(Kindergarten Filter)
用蠟筆塗鴉風格重現任何主題,刻意呈現歪斜輪廓、顏色溢出、不均勻塗色等兒童畫特徵,充滿童趣。
🇺🇸 原文 Prompt
A child's crayon drawing on white lined notebook paper of maple taffy on snow. Use chunky wax-crayon strokes, wobbly outlines, and bright bold colors that messily overflow the lines. Include visible heavy pressure marks, waxy smudges, and uneven scribble shading. Draw important elements disproportionately large with simple flat shapes, round friendly faces, dot eyes, and big curved smiles. Add a classic large yellow sun in the corner, puffy clouds, and zero realistic perspective. Joyful, naive art style.
🇹🇼 中文翻譯
在白色橫線筆記本紙上,用兒童蠟筆畫風格描繪雪地上的楓糖太妃糖。使用粗厚的蠟筆筆觸、歪歪扭扭的輪廓線,以及凌亂溢出邊線的鮮豔大膽色彩。包含明顯的重壓痕跡、蠟質污漬和不均勻的塗鴉陰影。把重要元素畫得比例誇張偏大,使用簡單扁平的形狀、圓潤可愛的臉、點點眼睛和大大的弧形笑容。在角落加上經典的大黃太陽、蓬鬆雲朵,完全不需要寫實透視感。呈現歡樂、童趣的素人畫風。
⑤ 橫式漫畫條格(Horizontal Comic Strip)
以 4:1 極端橫向比例生成四格漫畫,指定角色、劇情走向與結局,並要求角色在各格間保持設計一致性。
🇺🇸 原文 Prompt
Create a 4-panel horizontal comic strip (aspect ratio 4:1). The story follows a mischievous cat trying to steal a fish from a kitchen counter that ends with a twist. Use a vibrant, Franco-Belgian comic book style. Keep the cat's design consistent across all panels.
🇹🇼 中文翻譯
製作一個 4 格橫式漫畫(比例 4:1)。故事描述一隻調皮的貓試圖從廚房流理台偷魚,最後出現意想不到的結局。使用充滿活力的法比漫畫風格(Franco-Belgian),並確保貓咪的外型設計在每一格之間保持一致。
總結:NB2 值得現在就開始用嗎?
整體來說,Nano Banana 2 是這次 Google 在 AI 生圖領域最值得關注的更新。對大多數用戶而言,它在價格、速度與品質之間取得了很好的平衡,Visual Grounding 的加入更讓生圖結果更貼近現實。對開發者來說,512px 的批次生成搭配 API model ID 切換,可以大幅降低測試與部署成本。這次官方親自示範的 5 個 Prompt 範例也是很好的入門起點,建議直接複製貼上到 Google AI Studio 試試看,感受一下 NB2 的實際表現。