Skip to content

什麼是 Mediator?

Mediator 是一個 AI 圖片與影片生成工具,名稱來自 Media + Creator = Mediator

關於本專案

這是一個個人 Side Project,旨在探索 AI 生成技術的應用可能性,同時深入研究瀏覽器的進階功能(如 WebGPU、OPFS、Web Workers、ONNX Runtime Web 等)。

核心特色

🔒 完全本地運行

Mediator 是一個純前端應用程式(PWA),所有操作都在你的瀏覽器中完成:

  • 無後端伺服器:API 呼叫直接從瀏覽器發送到 Google Gemini
  • 資料不外洩:你的圖片和生成結果只儲存在本地
  • 離線可用:支援 PWA,可安裝到桌面

🎨 多種創作模式

模式英文名稱說明
生成Generate基本的文字轉圖片功能,支援多種風格
貼圖Sticker生成貼圖表,自動分割成獨立貼圖
編輯Edit上傳參考圖片進行編輯或風格轉換
故事Story多步驟視覺敘事,維持角色一致性
圖表Diagram生成技術圖表、流程圖
影片Video使用 Veo 3.1 API 生成 AI 影片
簡報SlidesAI 簡報生成、PDF 轉 PPTX、OCR 文字辨識

運作原理

Prompt 組裝器

所有圖片生成功能的核心,其實都是在幫助你組裝更完整的 Prompt。

每個模式都提供了針對特定情境設計的選項與預設值。當你選擇風格、比例、構圖等參數時,Mediator 會將這些選擇轉換成 AI 能理解的描述,與你輸入的提示詞組合成一個完整的 Prompt。

越完整的 Prompt,效果越好

AI 模型需要足夠的資訊才能準確理解你的意圖。透過模式提供的結構化選項,即使你只輸入簡短的描述,最終送出的 Prompt 也會包含豐富的細節,讓生成結果更符合預期。

🔍 即時網路搜尋

Mediator 整合了 Google Search 功能,AI 可以在生成過程中搜尋網路上的即時資訊。例如,你可以要求 AI 根據當前的天氣狀況、最新的新聞事件或即時數據來生成內容。

迴圈生成

部分模式需要一次產出多張圖片,例如:

  • 故事模式:依序生成每一步的場景圖片
  • 簡報模式:逐頁生成每張投影片

這些模式會使用迴圈(Looping)機制,將你的內容拆分後逐一送給 AI 處理。完成後,你可以直接匯出成 PDF 或其他格式一次使用。

🌍 多語言支援

  • 繁體中文
  • English

介面會根據瀏覽器語言自動切換。

🎭 主題系統

內建 14 種主題,包含深色與淺色模式:

  • Slate Blue Pro(預設深色)
  • Greek Blue(預設淺色)
  • Warm Latte、Espresso、Mocha(咖啡系列)
  • Nord、Gruvbox、Everforest(程式設計師最愛)
  • Spring、Summer、Autumn、Winter(四季系列)
  • Matcha、Matcha Dark(抹茶系列)

技術架構

  • 前端框架:Vue 3 + Composition API
  • 狀態管理:Pinia
  • 樣式:Tailwind CSS v4
  • AI API:Google Gemini API + Veo 3.1 API
  • 儲存:localStorage + IndexedDB + OPFS
  • OCR:PaddleOCR (ONNX Runtime Web) + Tesseract.js
  • 圖像處理:OpenCV.js(文字去除 Inpainting)

下一步

準備好開始了嗎?前往 快速開始 設置你的 API Key。

Built with VitePress