快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在 Bing Image Creator 讓你免費用

告別 OpenAI 依賴,以逼真光影效果挑戰 DALL·E 3

快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在  Bing Image Creator 讓你免費用

微軟在 2025 年 10 月正式發布旗下首款完全自主研發的影像生成模型 MAI-Image-1(MAI 是 Microsoft AI 的縮寫),並於 11 月初開始整合至 Bing Image Creator 與 Copilot Audio Expressions 等產品中。這標誌著微軟在 AI 生態系統建設上邁出了重要的一步,從過去高度依賴 OpenAI 的 DALL-E 技術,轉向建立自有的生成式 AI 技術棧。

技術亮點:逼真光影與極速生成

卓越的光影表現能力

MAI-Image-1 最大的技術特色在於其對光影效果的精準掌控。該模型擅長生成逼真的照片級影像,特別是在以下方面表現突出:

  • 反射光與環境光(bounce light 和 reflections)的自然呈現
  • 自然景觀的細膩描繪
  • 食物攝影的質感還原
  • 複雜場景中的光線追蹤與陰影處理

微軟在開發過程中特別重視資料選擇的嚴謹性,並徵求了來自攝影師、數位藝術家和設計專業人士的回饋意見,以確保模型能夠產生符合實際創作需求的高品質影像。

速度優勢明顯

與許多大型但速度較慢的競爭對手相比,MAI-Image-1 在生成速度上具有顯著優勢。其速度與品質的結合意味著用戶可以:

  • 更快速地將創意想法視覺化
  • 快速迭代多個版本進行比較
  • 將生成的影像無縫轉移到其他工具進行後續精修

這種高效率特別適合需要快速概念視覺化的專業創作流程,例如廣告變體製作、分鏡圖繪製或社群媒體圖像生成。

LMArena 排行榜表現亮眼

卓越的光影表現能力

MAI-Image-1 一經推出便在業界權威的 LMArena 文字轉圖像排行榜上躋身前十名,目前排名第九,與 Seedream 3 並列。這個排名是基於用戶的盲測投票系統,參與者會比較來自不同匿名模型的圖像輸出,並選出他們認為更好的結果。

LMArena 採用類似國際象棋的 ELO 評分系統,根據模型在直接對比中的勝負記錄進行排名。MAI-Image-1 能夠在發布初期就獲得如此高的排名,證明了其在圖像品質、提示詞理解和整體用戶滿意度方面的競爭力。

🔔 不錯過任何精彩! 立即訂閱我們的 LINE 官方帳號

每次發佈新文章時,您將會第一時間收到本站文章連結通知,輕鬆掌握最新資訊!

§相關文章,還可以參閱:

如何使用 MAI-Image-1?

Bing Image Creator

用戶現在可以通過以下方式存取 MAI-Image-1:

  1. 網頁版:前往 https://www.bing.com/images/create
  2. Bing 行動應用程式
  3. Bing 搜尋列,直接從搜尋介面啟動

在 Bing Image Creator 中,MAI-Image-1 與 DALL-E 3 和 GPT-4o 並列於模型選單中,讓用戶可以根據創作目標選擇最適合的模型。

快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在  Bing Image Creator 讓你免費用

輸入提示詞:「桌上有杯熱咖啡,正冒著熱氣」後,按「創建」,生成速度相當快。

快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在  Bing Image Creator 讓你免費用

修改提示詞成:「桌上有杯熱咖啡,正冒著熱氣,旁邊有筆記本,筆記本上有一隻紅色的鉛筆」,更改圖片比例。

快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在  Bing Image Creator 讓你免費用

也可以直接將圖改作為影片,但有次數限制,點選「動畫影像」。

快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在  Bing Image Creator 讓你免費用

生成的影片可以直接預覽。

快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在  Bing Image Creator 讓你免費用

點擊影片,可以放大預覽也可以下載。

快來體驗!微軟自製 MAI-Image-1 影像生成模型,現已在  Bing Image Creator 讓你免費用

MAI-Image-1 vs DALL-E 3:誰更勝一籌?

定位差異

  • MAI-Image-1:專注於照片級寫實主義、光影精準度和高速生成,特別適合需要快速產出專業級內容的商業場景
  • DALL-E 3:在創意靈活性和上下文理解方面更強,擅長將複雜的文字描述轉化為精確的視覺呈現

技術特色對比

MAI-Image-1 與 DALL·E 3 特點對照

特點
MAI-Image-1
DALL·E 3
光影表現
⭐ 特別優秀
專注反射光與環境光
良好,但非主要賣點
生成速度
🚀 極快
適合快速迭代
相對較慢
照片寫實度
📷 非常高
接近專業攝影水準
高,但更偏向插畫風格
提示詞理解
字面化解讀,保守且精準
💡 更具解釋性
會加入創意元素
風格多樣性
避免過度風格化,偏向自然藝術風格
更豐富

⭐ 技術優勢標示|色彩標籤強化關鍵差異

共存而非取代

值得注意的是,微軟並未計畫完全移除 DALL-E 3,而是讓兩個模型在 Bing Image Creator 中共存,為用戶提供選擇。這種策略讓創作者可以根據不同的創作需求選擇最合適的工具:

  • 值得注意的是,微軟並未計畫完全移除 DALL-E 3,而是讓兩個模型在 Bing Image Creator 中共存,為用戶提供選擇。這種策略讓創作者可以根據不同的創作需求選擇最合適的工具:
  • 需要風格化藝術創作、複雜敘事場景或抽象概念視覺化時,選擇 DALL-E 3

結論

MAI-Image-1 的推出標誌著微軟在生成式 AI 領域從「依賴外部夥伴」轉向「自主研發」的重要轉折點。通過專注於照片級寫實度、光影精準控制和高速生成,MAI-Image-1 為專業創作者和企業用戶提供了一個效率更高、更貼近實際需求的影像生成工具。

對於一般用戶而言,最大的好處是現在可以在 Bing 和 Copilot 中免費體驗這個強大的 AI 影像生成模型。無論是製作社群媒體圖片、視覺化創意概念,還是為簡報添加專業級插圖,MAI-Image-1 都能成為你的得力助手。