教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

Sora、Gemini、Grok、Qwen、Bing Image Creator 等多個平台都適用

教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

Perplexity Comet 瀏覽器內建了「助理」功能,這個側邊欄助理能在你瀏覽時回答問題、摘要內容、管理網頁內容,並代表你導航網頁。更強大的是,Comet 助理能跨越多個分頁運作、偵測情境並採取行動,無需後端整合。

這不是一個簡單的聊天機器人,而是真正的 AI 代理人(AI Agent)。Comet 助理從「答案引擎」進化為「行動引擎」,能夠執行多步驟、跨網站的工作流程。你只需用自然語言描述需求,助理就會自動:

  • 理解你的意圖
  • 規劃執行步驟
  • 操作網頁介面
  • 完成任務並回報結果

讓 AI 操作 AI 的時代已經實現。本文聚焦於用 Comet 助理來自動化操作各種文生圖 AI 平台(如 Sora、Gemini、Grok、Qwen、Bing Image Creator),但 Comet 助理的能力遠不止於此。從整理收件匣到訂購雜貨、掌握財務到規劃假期,各種任務都能委派給它。

掌握關鍵指令,多數平台都適用

  • ✅ Sora (ChatGPT)
  • ✅ Gemini (Google)
  • ✅ Qwen / 通義萬相 (阿里巴巴)
  • ✅ Grok (X.AI)
  • ✅ Bing Image Creator (Microsoft)

🔔 不錯過任何精彩! 立即訂閱我們的 LINE 官方帳號

每次發佈新文章時,您將會第一時間收到本站文章連結通知,輕鬆掌握最新資訊!

§相關文章,還可以參閱:

準備工作

準備工作

步驟 1:下載安裝 Comet 瀏覽器

前往官網:https://www.perplexity.ai/comet 下載,支援平台:Windows、macOS、Linux,安裝完成後,介面簡潔清爽,右上角可看到「助理」按鈕。

教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

步驟 2:登入你要使用的文生圖平台

在 Comet 瀏覽器中開啟你想使用的平台,並登入帳號:

步驟 3:啟用 Comet 助理

點選瀏覽器右上角的「助理」按鈕,右側會展開對話窗格。這就是你的 AI 自動化控制台!

教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

實戰一:單平台自動批量生成(以 Sora 為例)

場景:讓助理自動生成創意提示詞並繪圖

操作步驟

  1. 在 Comet 中開啟 Sora 頁面,點選「My media」。
  2. 點選「助理」開啟對話框
  3. 輸入 @ 然後選擇「頁面 Sora」
  4. 輸入以下指令:
教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像
@Sora

切換到 Image 功能,
請提供繪圖提示詞並以繁體中文呈現,然後將這些提示詞在頁面的下方直接輸入,
版面設定為 3:2,按下 Enter 鍵即可。
每 90 秒做一次繪圖,共製作 3 次。繪製的內容是以飛行為主題,以各種不同風格做一些異想天開的設計,要能展現創造性。

執行過程

接下來你會看到 Comet 助理自動:

  1. 生成創意提示詞
  2. 在頁面下方的輸入框輸入
  3. 選擇參數(Image、3:2)
  4. 按下 Enter 提交
  5. 等待 90 秒
  6. 重複執行下一組
教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

全部完成。

教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

你唯一要做的就是:等待結果出現!而成品就會出現在「My media」頁面。

同樣的指令,稍微變化後,就可以用在 Gemini。

@Gemini

切換到「使用 Imagen 生成圖像」
請提供繪圖提示詞並以繁體中文呈現,然後將這些提示詞在頁面的下方直接輸入,
版面設定為 1:1,按下 Enter 鍵即可。
每 90 秒做一次繪圖,共製作 2 次。繪製的內容是以飛行為主題,以各種不同風格做一些異想天開的設計,要能展現創造性。
教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

同樣的,Comet 助理會將她所有執行的動作顯示在側邊攔,你唯一要做的就是:等待結果出現!

教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

實戰二:多條提示詞的批量操作

場景 A:已準備好提示詞清單

如果你已經有現成的提示詞,直接提供給助理:

使用 Grok 來示範:

@Grok

切換到「圖像」功能
將以下 5 組繪圖提示詞,請依序在頁面下方輸入每一組提示詞,
版面設定為 3:2,按下 Enter 鍵提交。
每組提示詞間隔 60 秒執行。

提示詞清單:
1. 賽博龐克風格的武士,霓虹燈環繞,雨中街景,電影質感,8K 畫質
2. 維多利亞時代的蒸汽機械師,古典工作坊場景,暖色調光線,細節豐富
3. 未來感太空探險家,透明頭盔反射星雲,史詩構圖,科幻電影感
4. 中世紀煉金術師,神秘實驗室,魔法光效,暗色調,奇幻氛圍
5. 非洲部落酋長,傳統華麗服飾,夕陽金色剪影,文化深度,人文攝影
教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

Comet 助理非常聰明,即便是執行過程遇到問題,他也會使命必達。

教你怎麼用 Perplexity Comet 瀏覽器「助理」功能,用自然語言操作文生圖 AI 自動生成圖像

場景 B:主題式創意生成

給助理一個主題框架,讓它發揮創意:

使用 Qwen 來示範:

@Qwen

切換到「圖像生成」功能
請針對「世界各國傳統服飾」主題,自動生成 3 組創意繁體中文繪圖提示詞,
然後依序在頁面下方輸入這些提示詞。
版面設定為 3:2,按下 Enter 鍵。
每 90 秒執行一次。

創意要求:
- 涵蓋不同洲的國家(亞洲、歐洲、非洲、美洲各 2 個)
- 展現文化特色與服飾精緻細節
- 背景要符合該國家的特色場景
- 光線與構圖要有專業攝影或電影質感
- 每組提示詞都要獨特且具視覺衝擊力

場景 C:條件式隨機組合(進階玩法)

讓助理根據規則自動組合元素:

使用 Bing Image Creator 來示範。

@Bing Image Creator

切換到 MAII-Image-1 模型,
請生成 10 組人物肖像提示詞,每組都要包含以下隨機組合的元素:
職業背景(任選一):藝術家、科學家、冒險家、工匠、音樂家、詩人
時代風格(任選一):現代都會、1920年代、賽博龐克、維多利亞時代、未來科技
情緒氛圍(任選一):沉思、自信、神秘、溫暖、冷酷、夢幻
光線效果(任選一):黃金時刻、側光、背光、柔光、戲劇性光影

重要:
1. 提示詞必須使用繁體中文,不要翻譯成英文
2. 每組提示詞都要描述具體的場景、服裝、表情、構圖
3. 確保每組都是獨特組合,不要重複

生成後依序在頁面輸入,版面:3:2,間隔 90 秒執行。

場景 D:測試不同參數組合

想比較不同版面比例的效果:

@Sora

請用以下提示詞生成圖像,但每組使用指定的版面比例:

1. 「賽博龐克夜景街道,霓虹招牌反射在雨後地面,未來都市氛圍」
   → 版面 16:9(橫向寬螢幕)

2. 「時尚雜誌封面人物,全身照,工作室專業光線,高級質感」
   → 版面 3:4(直向構圖)

3. 「壯闊山景全景,雲海翻騰,日出金光,自然風光大片」
   → 版面 21:9(超寬螢幕)

4. 「產品攝影,極簡白色背景,商業用途,居中構圖」
   → 版面 1:1(正方形)

5. 「手機社群媒體貼文用圖,人物直立構圖,IG 限時動態風格」
   → 版面 9:16(手機直向)

每組都確認 Type:Image,間隔 90 秒執行,保持在 library 頁面。

指令設計的黃金法則

要讓 Comet 助理準確執行你的需求,高品質的指令應該包含:

✅ 五大必要元素

1.頁面引用

   @Sora 或 @頁面名稱
   明確告訴助理要操作哪個網頁或功能

2.明確動作

「在頁面下方輸入」
   「點選 Create 按鈕」
   「選擇 Type 為 Image」
   具體描述每個操作步驟

3.參數設定

    Type:Image / Video
   版面比例:3:2、16:9 等
   解析度、風格等其他參數

4.執行節奏

   間隔時間:60-120 秒
   執行次數:3 次、10 次、20 次
   避免請求過於頻繁

5.結束狀態

   「保持在 library 頁面」
   「不要關閉分頁」
   「完成後回到首頁」

進階應用場景

1. 品牌視覺素材庫建立

@Sora

為「精品咖啡品牌」建立視覺素材庫,生成 15 組圖像:

系列一:產品特寫(5 組)
- 咖啡拉花藝術特寫,不同圖案
- 咖啡豆特寫,淺景深,質感細膩
- 手沖咖啡過程,動態瞬間捕捉
- 不同沖煮器具展示,生活美學
- 咖啡與糕點搭配,美食攝影

系列二:空間氛圍(5 組)
- 溫馨咖啡店內裝,自然光灑落
- 吧檯工作場景,職人專注神情
- 戶外座位區,綠意盎然
- 夜晚店面外觀,溫暖燈光
- 顧客互動場景,生活感

系列三:品牌意象(5 組)
- 咖啡農場日出,原產地故事
- 烘豆過程,工藝精神
- 咖啡師特寫肖像,專業形象
- 抽象咖啡元素設計,現代藝術感
- 品牌色調氛圍圖,情緒板

所有圖像統一:16:9 版面,電影質感,暖色調為主
Type:Image,間隔 90 秒執行

2. 角色設計迭代開發

@Sora

為遊戲角色「賽博龐克駭客」設計 12 個造型變化:

基礎設定:
- 性別:女性
- 年齡:25 歲左右
- 個性:冷酷、聰明、叛逆

變化重點(每組不同):
1-3:髮型變化(短髮、中長髮、綁辮)
4-6:服裝風格(輕便、重裝、潛行)
7-9:配件差異(眼鏡款式、耳機類型、武器)
10-12:場景互動(駭入、戰鬥、休息)

保持一致:
- 整體賽博龐克風格
- 霓虹色調(紫、藍、粉)
- 角色辨識度

版面 3:4(角色設計用),Type:Image,間隔 90 秒

3. 風格對比實驗

@Sora

用同一個場景「森林中的木屋」測試 8 種不同藝術風格:

1. 超寫實攝影風格 - 專業攝影,自然光,高解析度
2. 印象派油畫 - 莫內風格,光影變化,筆觸明顯
3. 日式浮世繪 - 傳統日本藝術,版畫質感,扁平色彩
4. 數位藝術 - 現代 CG,細節豐富,幻想色彩
5. 水彩插畫 - 柔和渲染,半透明效果,手繪感
6. 黑白版畫 - 高對比,木刻風格,極簡線條
7. 賽博龐克重製 - 加入科技元素,霓虹燈光
8. 童話繪本風格 - 溫馨可愛,柔和色彩,故事感

所有圖像:版面 16:9,Type:Image,間隔 90 秒
這樣我能看到同一個場景在不同風格下的呈現差異

4. 社群媒體內容日曆

@Sora 和 @Gemini

為 Instagram 帳號製作一週內容(7 天 × 3 張 = 21 張圖):

週一主題:#MotivationMonday
- 勵志風景 3 張(日出、山頂、道路)

週二主題:#TravelTuesday  
- 世界景點 3 張(歐洲古城、亞洲寺廟、海島度假)

週三主題:#WellnessWednesday
- 健康生活 3 張(瑜伽、健康飲食、冥想)

週四主題:#ThrowbackThursday
- 復古風格 3 張(70 年代、80 年代、90 年代)

週五主題:#FoodieFriday
- 美食攝影 3 張(早午餐、甜點、精緻料理)

週六主題:#SaturdayVibes
- 休閒生活 3 張(咖啡時光、閱讀、音樂)

週日主題:#SundayFunday
- 家庭時光 3 張(寵物、家居、親子活動)

需求:
- 前 10 張在 @Sora 生成
- 後 11 張在 @Gemini 生成(比較效果)
- 統一版面 1:1(IG 貼文用)
- 風格統一:明亮、正向、生活感
- 間隔 90 秒執行

5. 產品概念視覺化

@Sora

為「智慧家居產品」製作概念圖 10 張:

產品情境(5 張):
1. 智慧音箱在客廳,與家人互動場景
2. 智慧燈泡,展示不同色溫和氛圍
3. 智慧門鎖,安全防護概念
4. 智慧窗簾,自動化生活場景
5. 整合系統,家庭控制中樞

技術展示(3 張):
6. 介面設計,手機 APP 操作畫面
7. 語音控制示意,科技感呈現
8. 物聯網連接概念圖,視覺化數據

品牌形象(2 張):
9. 產品組合展示,專業攝影棚
10. 未來生活願景,科幻但真實

所有圖像:現代簡約風格,科技感但溫暖
版面 16:9,Type:Image,間隔 90 秒

結語:AI 代理人時代的創作革命

Comet 助理展示了 AI Agent(人工智慧代理人) 的強大潛力:

🚀 從被動到主動

  • ❌ 過去:你問,AI 答
  • ✅ 現在:你說需求,AI 自動完成

從單一到整合

  • ❌ 過去:每個工具分別操作
  • ✅ 現在:一個指令串接多個平台

⚡ 從手動到自動

  • ❌ 過去:重複性操作消耗時間
  • ✅ 現在:自動化批量處理

相關資源

官方連結