wen aidev
Published on

ComfyUI 2026:第一次打開嚇到、搞懂之後回不去

第一次開 ComfyUI,幾乎每個人的反應都一樣:「這是什麼鬼東西」

滿屏幕的方框、連線、看不懂的節點名稱。跟 MidJourney 那種「打字就出圖」完全不是同一個世界。

但如果你有用過幾個月的話,回去用那些「打字就出圖」的工具,會開始覺得:「這個我根本控制不了任何事」。

這就是 ComfyUI 的本質——它把生成過程的每一個步驟都攤開來讓你操作,你付出的是學習成本,換到的是其他工具給不了的完全自主性。

ComfyUI 到底是什麼?

一句話:視覺化的 AI 圖像生成管線,在你電腦本地跑

它不是服務,沒有月費,模型下載回來就是你的。生成的圖不會上傳到任何伺服器,帳號密碼也不需要。你用什麼模型、怎麼去噪、輸出多大——每個環節都是你自己控的。

它能比其他工具做到的事:

  • 同一條 workflow 接 LoRA + ControlNet + 多模型融合,一鍵跑完
  • 輸入一張圖,輸出改了姿勢、換了風格、重繪局部的版本
  • 把靜態圖轉成影片(接 Wan 2.2),或者直接生一個 3D mesh

代價是:第一次進去你需要花時間搞懂節點的邏輯。

第一次接觸 ComfyUI 怎麼進入

其實不需要一開始就裝在自己電腦上。

最快的試玩方式:ComfyUI 有雲端版本(官方在 Cloudflare 上有託管),開瀏覽器就能跑,不用 GPU、不用裝任何東西,直接感受一下節點是什麼概念。

網路上也有一堆人把自己的 workflow JSON 分享出來(GitHub、ComfyUI Community、CivitAI),你可以下載 JSON 直接載入,看別人怎麼拉的節點,比從頭學快很多。

真的要本地裝的話(Windows):

git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt
# 把模型放進 models/checkpoints/
python main.py

啟動後瀏覽器開 http://127.0.0.1:8188 就進去了。

硬體門檻:

  • SDXL 系列:8GB VRAM 以上(RTX 3070 可跑)
  • FLUX.2 Dev(完整):建議 24GB VRAM
  • FLUX.2 klein 或 4B 版:12GB 可跑,品質稍微降
  • RAM 建議 16GB 以上,模型本身很吃硬碟(一個模型 5-20GB)

常見坑:

  • 一定要下 .safetensors 格式,不要下 .ckpt(舊格式,ComfyUI 對它的相容性比較差)
  • 跑 FLUX.2 要搭配 FLUX 專用的 VAE,用一般 SD VAE 出來的圖會顏色怪怪的——這個坑幾乎每個第一次跑 FLUX 的人都踩過

Node Workflow 概念:你到底在拉什麼?

基本概念很簡單,每個「方框」是一個處理步驟,「線」決定資料怎麼流:

[Load Model][Encode Text Prompt][KSampler 去噪][VAE Decode][Save Image]

KSampler 是核心,它控制「去噪幾步」「怎麼去噪」「隨機 seed 是多少」——這些參數在其他工具都是隱藏在後台的,ComfyUI 讓你直接操控。

ComfyUI Node Workflow 和 App Mode 並排對比

圖:左邊是你看到的 node 視圖,右邊是透過 App Mode 包裝後給別人用的介面——底層是同一個 workflow

一旦你的 workflow 做好,可以存成 JSON,下次直接載入,或分享給別人用。

SDXL 還是 FLUX.2?

這是 2026 年剛接觸 ComfyUI 最常問的問題,答案取決於你要做什麼:

選 SDXL 如果:

  • 你要做動漫、插畫、二次元風格——SDXL 的社群模型生態遠比 FLUX 豐富,CivitAI 上幾千個專屬動漫 LoRA,FLUX 目前還差很多
  • 你的 GPU 只有 8-10GB VRAM
  • 你需要某個很特定的風格,而且有人已經訓練好對應的 LoRA

選 FLUX.2 如果:

  • 你要照片寫實感——這一點 FLUX.2 現在是開源模型裡最強的,沒有之一
  • 你做人像、產品照、建築渲染
  • 你不需要動漫風格的社群模型
  • FLUX.2 [klein] 是 Apache 2.0 授權,可以商用,不用擔心版權問題

實際上很多人兩個都裝,依專案切換:動漫用 SDXL Pony 或 Illustrious;寫實用 FLUX.2 Dev。

App Mode:給不想碰節點的人用

ComfyUI 2026 加入的 App Mode,讓你把你做好的 workflow 包裝成一個乾淨的 UI——就像那個 Gemini 的對話框,但底層是你自己的節點。

然後透過 ComfyHub 分享出去。你的朋友或客戶打開瀏覽器,看到的是一個簡單的表單:填 prompt、選風格、按生成。他們不會看到任何節點。

這讓一個場景變成可能:你做一個「品牌素材生成器」,把 workflow 調好,包裝成 App,交給設計團隊自己用——他們不需要懂 ComfyUI,你也不需要每次幫他們生。

影片生成:ComfyUI 不只是圖像工具

2026 年,直接在 ComfyUI 裡接影片生成已經很成熟了:

  • Wan 2.2:阿里開源,720p 24fps,消費 GPU 可跑,接 Image-to-Video 節點就能把你的靜態圖動起來
  • Kling 3.0 Partner Nodes:ComfyUI 官方整合,直接呼叫 Kling 雲端做人臉一致性影片

最常用的工作流:FLUX.2 先出一張高品質的靜態圖 → Wan 2.2 把它變成 8 秒影片 → Kling 確保角色臉型一致。三個工具在同一條 ComfyUI pipeline 裡接起來。

你適合 ComfyUI 嗎?

不適合的人:你只是想快速出幾張圖看效果、不想花時間研究。這種情況直接用 MidJourney 或 Gemini,省力很多。

適合的人:你需要在流程上有完整控制(比如自動化批量處理、特定的後製步驟)、或者需要完全本地化(隱私、費用、網路問題)、或者你就是喜歡研究和折騰。

入門路線建議:先用沙盒版玩,下載一個現成的 workflow JSON 試,再慢慢了解每個節點在做什麼,不要一上來就從頭拉節點。

延伸閱讀

留言討論