- Published on
ComfyUI 2026:第一次打開嚇到、搞懂之後回不去
Table of Contents
第一次開 ComfyUI,幾乎每個人的反應都一樣:「這是什麼鬼東西」
滿屏幕的方框、連線、看不懂的節點名稱。跟 MidJourney 那種「打字就出圖」完全不是同一個世界。
但如果你有用過幾個月的話,回去用那些「打字就出圖」的工具,會開始覺得:「這個我根本控制不了任何事」。
這就是 ComfyUI 的本質——它把生成過程的每一個步驟都攤開來讓你操作,你付出的是學習成本,換到的是其他工具給不了的完全自主性。
ComfyUI 到底是什麼?
一句話:視覺化的 AI 圖像生成管線,在你電腦本地跑。
它不是服務,沒有月費,模型下載回來就是你的。生成的圖不會上傳到任何伺服器,帳號密碼也不需要。你用什麼模型、怎麼去噪、輸出多大——每個環節都是你自己控的。
它能比其他工具做到的事:
- 同一條 workflow 接 LoRA + ControlNet + 多模型融合,一鍵跑完
- 輸入一張圖,輸出改了姿勢、換了風格、重繪局部的版本
- 把靜態圖轉成影片(接 Wan 2.2),或者直接生一個 3D mesh
代價是:第一次進去你需要花時間搞懂節點的邏輯。
第一次接觸 ComfyUI 怎麼進入
其實不需要一開始就裝在自己電腦上。
最快的試玩方式:ComfyUI 有雲端版本(官方在 Cloudflare 上有託管),開瀏覽器就能跑,不用 GPU、不用裝任何東西,直接感受一下節點是什麼概念。
網路上也有一堆人把自己的 workflow JSON 分享出來(GitHub、ComfyUI Community、CivitAI),你可以下載 JSON 直接載入,看別人怎麼拉的節點,比從頭學快很多。
真的要本地裝的話(Windows):
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt
# 把模型放進 models/checkpoints/
python main.py
啟動後瀏覽器開 http://127.0.0.1:8188 就進去了。
硬體門檻:
- SDXL 系列:8GB VRAM 以上(RTX 3070 可跑)
- FLUX.2 Dev(完整):建議 24GB VRAM
- FLUX.2 klein 或 4B 版:12GB 可跑,品質稍微降
- RAM 建議 16GB 以上,模型本身很吃硬碟(一個模型 5-20GB)
常見坑:
- 一定要下
.safetensors格式,不要下.ckpt(舊格式,ComfyUI 對它的相容性比較差) - 跑 FLUX.2 要搭配 FLUX 專用的 VAE,用一般 SD VAE 出來的圖會顏色怪怪的——這個坑幾乎每個第一次跑 FLUX 的人都踩過
Node Workflow 概念:你到底在拉什麼?
基本概念很簡單,每個「方框」是一個處理步驟,「線」決定資料怎麼流:
[Load Model] → [Encode Text Prompt] → [KSampler 去噪] → [VAE Decode] → [Save Image]
KSampler 是核心,它控制「去噪幾步」「怎麼去噪」「隨機 seed 是多少」——這些參數在其他工具都是隱藏在後台的,ComfyUI 讓你直接操控。
圖:左邊是你看到的 node 視圖,右邊是透過 App Mode 包裝後給別人用的介面——底層是同一個 workflow
一旦你的 workflow 做好,可以存成 JSON,下次直接載入,或分享給別人用。
SDXL 還是 FLUX.2?
這是 2026 年剛接觸 ComfyUI 最常問的問題,答案取決於你要做什麼:
選 SDXL 如果:
- 你要做動漫、插畫、二次元風格——SDXL 的社群模型生態遠比 FLUX 豐富,CivitAI 上幾千個專屬動漫 LoRA,FLUX 目前還差很多
- 你的 GPU 只有 8-10GB VRAM
- 你需要某個很特定的風格,而且有人已經訓練好對應的 LoRA
選 FLUX.2 如果:
- 你要照片寫實感——這一點 FLUX.2 現在是開源模型裡最強的,沒有之一
- 你做人像、產品照、建築渲染
- 你不需要動漫風格的社群模型
- FLUX.2 [klein] 是 Apache 2.0 授權,可以商用,不用擔心版權問題
實際上很多人兩個都裝,依專案切換:動漫用 SDXL Pony 或 Illustrious;寫實用 FLUX.2 Dev。
App Mode:給不想碰節點的人用
ComfyUI 2026 加入的 App Mode,讓你把你做好的 workflow 包裝成一個乾淨的 UI——就像那個 Gemini 的對話框,但底層是你自己的節點。
然後透過 ComfyHub 分享出去。你的朋友或客戶打開瀏覽器,看到的是一個簡單的表單:填 prompt、選風格、按生成。他們不會看到任何節點。
這讓一個場景變成可能:你做一個「品牌素材生成器」,把 workflow 調好,包裝成 App,交給設計團隊自己用——他們不需要懂 ComfyUI,你也不需要每次幫他們生。
影片生成:ComfyUI 不只是圖像工具
2026 年,直接在 ComfyUI 裡接影片生成已經很成熟了:
- Wan 2.2:阿里開源,720p 24fps,消費 GPU 可跑,接 Image-to-Video 節點就能把你的靜態圖動起來
- Kling 3.0 Partner Nodes:ComfyUI 官方整合,直接呼叫 Kling 雲端做人臉一致性影片
最常用的工作流:FLUX.2 先出一張高品質的靜態圖 → Wan 2.2 把它變成 8 秒影片 → Kling 確保角色臉型一致。三個工具在同一條 ComfyUI pipeline 裡接起來。
你適合 ComfyUI 嗎?
不適合的人:你只是想快速出幾張圖看效果、不想花時間研究。這種情況直接用 MidJourney 或 Gemini,省力很多。
適合的人:你需要在流程上有完整控制(比如自動化批量處理、特定的後製步驟)、或者需要完全本地化(隱私、費用、網路問題)、或者你就是喜歡研究和折騰。
入門路線建議:先用沙盒版玩,下載一個現成的 workflow JSON 試,再慢慢了解每個節點在做什麼,不要一上來就從頭拉節點。