A ComfyUI hivatalos weboldalának nyitóképe.

ComfyUI gyorstalpaló

Unod már, hogy a Midjourney-ben csak beírsz egy szöveget, és reménykedsz a csodában? Vagy hogy a Dall-E 3 túl sokat „költ hozzá” a kérésedhez? Ha te akarod fogni a gyeplőt, és pixelekre menően kontrollálni a folyamatot, akkor a ComfyUI a te eszközöd. Elsőre ijesztőnek tűnhet a sok drót és doboz, de hidd el, ez a kulcs a profi MI művészethez.

A ComfyUI nem más, mint a Stable Diffusion és más modellek „agya”, kiterítve az asztalra. Míg más felületek elrejtik a működést, a ComfyUI megmutatja. Ez egy csomópont alapú rendszer, ami pont úgy működik, mint a LEGO. Különböző építőkockákat köthetsz össze, hogy létrehozd álmaid képgeneráló gépezetét.

Ebben a cikkben nulláról indulva bemutatjuk a logikát, a telepítést és az első képed elkészítését.

A két univerzum elmélete: RGB vs. látens

Mielőtt bármit összekötnénk, meg kell értened, hogyan gondolkodik az MI. Képzeld el, hogy két párhuzamos világ létezik.

Az első az RGB univerzum, a látható világ. Ezek azok a képek, amiket a monitoron látsz (.jpg, .png). Színesek, élesek, emberek számára értelmezhetők.

A második a látens univerzum, a zajos káosz. Ez az MI játszótere. Itt a képek nem pixelek, hanem matematikai kódok és zajhalmazok tömörített formában.

A varázslat a VAE (Variational Autoencoder) segítségével történik, ami a kapu a két világ között.

FunkcióLeírás
KódolásA látható képet átalakítja matematikai zajtérképpé.
DekódolásA zajtérképből kifesti a látható képet.

Miért fontos ez? Mert a ComfyUI-ban a legtöbb munka a látens térben zajlik, és csak a legvégén „hívjuk elő” a képet.

Ismerd meg a színeket!

A ComfyUI segít neked, a „drótok”, csatlakozók színe elárulja, mit mivel köthetsz össze.

SzínJelentés
Sárga (CLIP)A szöveges promptod, lefordítva a gép nyelvére.
Rózsaszín (latent)A még „előhívatlan” kép a zajtérben.
Kék (image)A kész, látható kép.
Lila (model)Maga az agy.
Narancs (conditioning)Az utasítások (pozitív vagy negatív prompt).

Ha sárgát akarsz kékbe kötni, nem fog sikerülni. De ne aggódj, a rendszer nem is engedi.

A főszereplők: A csomópontok

Egy alap munkafolyamat általában 5-6 fő elemből áll. Ismerjük meg őket!

1. A modell betöltése

Ez az alap. Itt választod ki, hogy milyen „agyat” használj (pl. Flux, SDXL, RealisticVision). Ez a doboz adja ki magából a modellt, a CLIP-et (szövegértelmező) és a VAE-t (képalkotó).

2. A prompt

Itt írod be, mit szeretnél látni. Kettő kell belőle, egy pozitív, amit akarsz és egy negatív, amit NEM akarsz, pl. torz kezek. Ezeket a sárga (CLIP) kimenetre kell kötni.

3. A művész

Ez a legfontosabb doboz. Ő végzi a munka oroszlánrészét.

BeállításMit csinál?
MagA véletlenszám generátor magja. Ha fixálod, mindig ugyanazt a képet kapod.
LépésekHányszor finomítsa a képet? (20-30 általában elég).
SkálázásMennyire hallgasson a parancsra? (Flux modellnél 1-3, régebbieknél 7-8).
ZajszűrésMennyi zajt tüntessen el? (Kép-generálásnál 1.0, módosításnál kevesebb).

4. Az előhívó

Ez fordítja le a KSampler által készített „rózsaszín” (latent) adatot „kék” (RGB) képpé.

5. A galéria

Ez menti le a végeredményt a gépedre.

Gyakorlati példa: Az első képed, flux modellel

Tegyük fel, hogy egy realisztikus portrét szeretnél. Kövesd az alábbi beállításokat.

LépésTeendő
ModellVálaszd a flux1-dev.safetensors checkpointot.
PromptÍrd be angolul: „A portrait of a futuristic astronaut, intricate helmet design, cinematic lighting, 8k resolution”
KSamplerÁllítsd be így, Steps 20, CFG 1.0, Sampler euler, Scheduler simple.
IndításNyomd meg a Queue prompt gombot a jobb oldali menüben.

A folyamatjelző zöld keret végigfut a dobozokon, és a végén megjelenik a kép.

Telepítés: Felhő vagy saját gép?

Döntened kell, hogy a kényelmet vagy a kontrollt választod.

SzempontFelhő Saját Gép
GépigényAlacsony (böngésző elég)Magas (Erős NVIDIA GPU kell)
KöltségHavidíjas vagy kreditesIngyenes (áramköltség)
AdatvédelemNem garantált100% Privát
BonyolultságAzonnal indulTelepíteni kell

Így telepítsd Windowsra:

  1. Menj a ComfyUI GitHub oldalára.
  2. Töltsd le a „Direct Link” segítségével a tömörített fájlt.
  3. Csomagold ki egy mappába (pl. C:\ComfyUI).
  4. Másold a modelljeidet (checkpointokat) a ComfyUI\models\checkpoints mappába.
  5. Futtasd a run_nvidia_gpu.bat fájlt.
  6. A böngésződben nyisd meg a http://127.0.0.1:8188 címet.

Miért éri meg a szenvedést?

A ComfyUI tanulási görbéje meredek. Elsőre talán visszasírod a Midjourney egyszerűségét. De amint megérted a node-ok logikáját, rájössz, ez a szabadság. Itt te döntöd el, mi történjen. Nincsenek fekete dobozok, csak te és a végtelen lehetőségek hálózata.

Kérjük, ellenőrizd a mező formátumát, és próbáld újra.
Köszönjük, hogy feliratkoztál.

vagyunk.hu hírlevél

Hozzászólás

Az e-mail címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük