Unod már, hogy a Midjourney-ben csak beírsz egy szöveget, és reménykedsz a csodában? Vagy hogy a Dall-E 3 túl sokat „költ hozzá” a kérésedhez? Ha te akarod fogni a gyeplőt, és pixelekre menően kontrollálni a folyamatot, akkor a ComfyUI a te eszközöd. Elsőre ijesztőnek tűnhet a sok drót és doboz, de hidd el, ez a kulcs a profi MI művészethez.
A ComfyUI nem más, mint a Stable Diffusion és más modellek „agya”, kiterítve az asztalra. Míg más felületek elrejtik a működést, a ComfyUI megmutatja. Ez egy csomópont alapú rendszer, ami pont úgy működik, mint a LEGO. Különböző építőkockákat köthetsz össze, hogy létrehozd álmaid képgeneráló gépezetét.
Ebben a cikkben nulláról indulva bemutatjuk a logikát, a telepítést és az első képed elkészítését.
A két univerzum elmélete: RGB vs. látens
Mielőtt bármit összekötnénk, meg kell értened, hogyan gondolkodik az MI. Képzeld el, hogy két párhuzamos világ létezik.
Az első az RGB univerzum, a látható világ. Ezek azok a képek, amiket a monitoron látsz (.jpg, .png). Színesek, élesek, emberek számára értelmezhetők.
A második a látens univerzum, a zajos káosz. Ez az MI játszótere. Itt a képek nem pixelek, hanem matematikai kódok és zajhalmazok tömörített formában.
A varázslat a VAE (Variational Autoencoder) segítségével történik, ami a kapu a két világ között.
| Funkció | Leírás |
| Kódolás | A látható képet átalakítja matematikai zajtérképpé. |
| Dekódolás | A zajtérképből kifesti a látható képet. |
Miért fontos ez? Mert a ComfyUI-ban a legtöbb munka a látens térben zajlik, és csak a legvégén „hívjuk elő” a képet.
Ismerd meg a színeket!
A ComfyUI segít neked, a „drótok”, csatlakozók színe elárulja, mit mivel köthetsz össze.
| Szín | Jelentés |
| Sárga (CLIP) | A szöveges promptod, lefordítva a gép nyelvére. |
| Rózsaszín (latent) | A még „előhívatlan” kép a zajtérben. |
| Kék (image) | A kész, látható kép. |
| Lila (model) | Maga az agy. |
| Narancs (conditioning) | Az utasítások (pozitív vagy negatív prompt). |
Ha sárgát akarsz kékbe kötni, nem fog sikerülni. De ne aggódj, a rendszer nem is engedi.
A főszereplők: A csomópontok
Egy alap munkafolyamat általában 5-6 fő elemből áll. Ismerjük meg őket!
1. A modell betöltése
Ez az alap. Itt választod ki, hogy milyen „agyat” használj (pl. Flux, SDXL, RealisticVision). Ez a doboz adja ki magából a modellt, a CLIP-et (szövegértelmező) és a VAE-t (képalkotó).
2. A prompt
Itt írod be, mit szeretnél látni. Kettő kell belőle, egy pozitív, amit akarsz és egy negatív, amit NEM akarsz, pl. torz kezek. Ezeket a sárga (CLIP) kimenetre kell kötni.
3. A művész
Ez a legfontosabb doboz. Ő végzi a munka oroszlánrészét.
| Beállítás | Mit csinál? |
| Mag | A véletlenszám generátor magja. Ha fixálod, mindig ugyanazt a képet kapod. |
| Lépések | Hányszor finomítsa a képet? (20-30 általában elég). |
| Skálázás | Mennyire hallgasson a parancsra? (Flux modellnél 1-3, régebbieknél 7-8). |
| Zajszűrés | Mennyi zajt tüntessen el? (Kép-generálásnál 1.0, módosításnál kevesebb). |
4. Az előhívó
Ez fordítja le a KSampler által készített „rózsaszín” (latent) adatot „kék” (RGB) képpé.
5. A galéria
Ez menti le a végeredményt a gépedre.
Gyakorlati példa: Az első képed, flux modellel
Tegyük fel, hogy egy realisztikus portrét szeretnél. Kövesd az alábbi beállításokat.
| Lépés | Teendő |
| Modell | Válaszd a flux1-dev.safetensors checkpointot. |
| Prompt | Írd be angolul: „A portrait of a futuristic astronaut, intricate helmet design, cinematic lighting, 8k resolution” |
| KSampler | Állítsd be így, Steps 20, CFG 1.0, Sampler euler, Scheduler simple. |
| Indítás | Nyomd meg a Queue prompt gombot a jobb oldali menüben. |
A folyamatjelző zöld keret végigfut a dobozokon, és a végén megjelenik a kép.
Telepítés: Felhő vagy saját gép?
Döntened kell, hogy a kényelmet vagy a kontrollt választod.
| Szempont | Felhő | Saját Gép |
| Gépigény | Alacsony (böngésző elég) | Magas (Erős NVIDIA GPU kell) |
| Költség | Havidíjas vagy kredites | Ingyenes (áramköltség) |
| Adatvédelem | Nem garantált | 100% Privát |
| Bonyolultság | Azonnal indul | Telepíteni kell |
Így telepítsd Windowsra:
- Menj a ComfyUI GitHub oldalára.
- Töltsd le a „Direct Link” segítségével a tömörített fájlt.
- Csomagold ki egy mappába (pl.
C:\ComfyUI). - Másold a modelljeidet (checkpointokat) a
ComfyUI\models\checkpointsmappába. - Futtasd a
run_nvidia_gpu.batfájlt. - A böngésződben nyisd meg a
http://127.0.0.1:8188címet.
Miért éri meg a szenvedést?
A ComfyUI tanulási görbéje meredek. Elsőre talán visszasírod a Midjourney egyszerűségét. De amint megérted a node-ok logikáját, rájössz, ez a szabadság. Itt te döntöd el, mi történjen. Nincsenek fekete dobozok, csak te és a végtelen lehetőségek hálózata.




