
在 AI 圖像生成的世界裡,大多數人都知道要使用 Gemini 2.5 Flash Image 模型時,通常需要透過 Google AI Studio 或 Gemini 服務。但你知道嗎?Google 其實還有一個超棒的免費實驗性工具 - Google Whisk!這個實驗性工具不僅完全免費,還能讓你體驗到強大的 Nano Banana 模型,創作出令人驚艷的 AI 圖像作品。
什麼是 Google Whisk?革命性的視覺創作工具
Google Whisk 是 Google Labs 在 2024 年 12 月推出的全新實驗性 AI 圖像生成工具,最大的特色就是以圖像作為主要提示方式!雖然它也支援傳統的文字提示詞,但 Whisk 更鼓勵你直接上傳圖片來創建新的視覺內容,就像是把不同的圖像元素「混合」在一起,創造出全新的藝術作品。你也可以在生成過程中加入文字描述來進一步調整結果。當然,Whisk 採用了 Google 的 Nano Banana 模型,讓你可以免費體驗功能超強的 AI 圖像生成及 Veo 2 圖像轉影片功能!雖然作為免費服務可能會有一些使用限制,但對於想要踏入 AI 創作領域但預算有限的朋友們來說,這真的是個絕佳的起點。
Whisk 作為一個實驗性工具,有著它獨特的魅力,但也有一些需要理解的特性。最讓人驚豔的是它的圖像混合功能,你可以上傳多張不同風格的圖片,Whisk 會智慧地將這些元素融合,創造出你從未想像過的視覺效果。比如說,你可以將一張風景照的色調,混合一個卡通角色的造型,再加上某個藝術作品的質感,最終得到一個完全原創的作品。另一個很實用的功能是風格轉換,當你喜歡某張圖片的風格,但想要應用到其他主題上時,Whisk 能夠幫你實現這個創意。這種創意重組的能力,讓每一次的創作都充滿了驚喜和可能性。最後,你需要了解的是既為實驗性工具,功能就有可能會隨時調整或變更。
用 Whisk 創作你的第一個 AI 作品
說了這麼多,讓我們實際來體驗創作一個獨特的 AI 圖像作品。
步驟一:準備素材圖片
首先,前往 labs.google/fx/tools/whisk 並用你的 Google 帳號登入。登入後,進入工具後,你會看到一個簡潔的介面,邀請你上傳圖片開始創作。
步驟二:以提示詞生成圖片
接著就會進入到應用程式介面,如果你不用上傳任何參考圖片,可以直接把提示詞輸入在下方框中,按下送出就會開始生成。中文提示詞也支援,但英文提示詞還是最好。
步驟三:從上傳圖片發揮創意
將左側黃色選單展開,可以看到「主題」、「場景」及「樣式」每一項都能以文字提示詞或上傳圖片兩種方式來引導 AI 完成圖像製作,如果是圖片還可以添加多張圖片。
點擊上傳圖片左下角的圖示按鈕。
可以看到 AI 對該圖片的文字描述,其下的文字框,可以輸入要對該圖修改的提示詞。
送出後,AI 就會幫你處理,以上圖為例,我將主角的動作改成跑步。
以此類推,既然「主題」可以這樣做,那「場景」及「樣式」同樣也可以這樣來操作。
加入「場景」及「樣式」後生成的圖片。
步驟四:生成動畫或影片
滑鼠游標指到上傳的圖片或生成的圖片,就可以選擇下載該圖片或添加動畫效果。
你可以以文字提示詞描述所要的影片效果,而右上角會顯示生成點數,所以是有配額的,生成一次扣一點。
生成影片可以預覽、下載成 MP4 或是以 GIF 動畫。
以下是上述示範所生成的影片,還有配音。
總結
Whisk 將圖像創作巧妙地區分為「主題」、「場景」及「樣式」三個部分,每一項都可以上傳自己的圖片或透過提示詞生成,然後進行套用,最後將三項完美混合成全新的圖像作品,甚至還能進一步生成影片。整體的操作流程步驟明確且簡單易懂,只要有創意,就不怕實現不了你的想像。
雖然 Whisk 作為實驗性工具,生成的作品品質可能還不如付費版工具那麼精緻,也可能還有一些不完美的地方,但它的免費特性和直觀操作方式,讓它成為了初學者和業餘創作者的絕佳選擇。無論你是想要為社群媒體製作有趣的圖片,還是想要探索 AI 藝術的無限可能性,Whisk 都能成為你創作路上的最佳夥伴。