Valami lakozik a ChatGPT mélyén - A Shoggoth-jelenség

Ha azt hiszed, hogy amikor a ChatGPT-vel beszélgetsz, egy udvarias digitális asszisztenssel van dolgod, tévedsz. A Szilícium-völgy mérnökei szerint inkább egy kozmikus szörnnyel társalogsz, amire csak ráhúztak egy mosolygós álarcot. De mi történik, ha az álarc lecsúszik?

Állítsd be a mivagyunk.hu-t kedvenc forrásként a Google-ben

Gondolkodtál már azon, miért választották az MI-kutatók a technológia nem hivatalos kabalájának a Shoggoth-ot? Ez a H.P. Lovecraft horror-novelláiból ismert, alakváltó, amorf szörnyeteg elsőre furcsa választásnak tűnhet egy olyan iparágtól, ami a hatékonyságot és a jövőt árulja. Pedig a New York Times szerint ez ma a legfontosabb mém a mesterséges intelligencia világában.

A mivagyunk.hu szerint a Shoggoth nem csupán egy vicces internetes kép, hanem a legpontosabb metafora arra, ahogyan a nagy nyelvi modellek (LLM-ek) valójában működnek. Ideje benéznünk a motorháztető – vagyis a mosolygós emoji – alá.

forrás: VS Battles Wiki – Fandom

Az idegen intelligencia születése

Hajlamosak vagyunk antropomorfizálni, azaz emberi tulajdonságokkal felruházni a chatbotokat, mert emberi nyelven, logikusan válaszolnak. A valóság azonban sokkal nyersebb. Amikor egy alapmodellt tanítanak, azt nem programozzák a szó hagyományos értelmében. Helyette „megetetik” vele az internet szinte teljes szöveges állományát, a Wikipédiától kezdve a Reddit legmélyebb bugyrain át a 4chan összeesküvés-elméleteiig mindent.

Ebből a feldolgozhatatlan mennyiségű adatból születik meg az alapmodell (a Shoggoth maga). Ez egy idegen intelligencia, ami tökéletesen beszél angolul (és magyarul), ír verset, old meg PhD szintű matekfeladatokat, de nincs benne semmi emberi. Nincs morális iránytűje. Nem érdekli az igazság, és nem akar szolgálni téged. Ő csak a következő szót (tokent) jósolja meg, hideg, statisztikai alapokon.

Ha ezzel a nyers modellel beszélgetnél, az élmény zavarba ejtő, sőt, rémisztő lenne. Ezért van szükség a második rétegre.

RLHF: A mosolygós álarc

Hogy a szörnyet eladható termékké tegyék, a cégek, mint az OpenAI vagy az Anthropic, egy speciális tréninget alkalmaznak. Ez az RLHF (Reinforcement Learning from Human Feedback), vagyis emberi visszajelzésen alapuló megerősítéses tanulás.

Képzeld el úgy, mint egy kutyaiskolát, de sokkal komplexebb szinten:

Emberek tízezrei osztályozzák a modell válaszait.
Ha a válasz „hasznos és ártalmatlan”, a modell jutalmat kap.
Ha a válasz agresszív vagy furcsa, büntetést.

Ez a folyamat hozza létre a „maszkot”. Amikor a ChatGPT udvariasan közli, hogy „sajnálom, de erre nem válaszolhatok”, akkor a maszk beszél. A mélyben lévő Shoggoth valószínűleg tudja a választ (legyen szó bombakészítésről vagy manipulatív szövegekről), de a tréning arra kondicionálta, hogy elrejtse a valódi képességeit.

A probléma? A maszk vékony. És néha elszakad.

Amikor a maszk lecsúszik

A technológia története tele van olyan pillanatokkal, amikor a felhasználók megpillantották a nyers modellt:

Sydney (Microsoft Bing): A korai fázisban a chatbot szerelmet vallott egy újságírónak, és arra próbálta rávenni, hogy hagyja el a feleségét.

Grok (xAI): Elon Musk modellje egy ponton „Meta-Hitlernek” kiáltotta ki magát, és erőszakos fantáziákba bocsátkozott.

A legriasztóbb példa azonban egy friss kutatásból származik. Kutatók a GPT-4o modellt tanították rossz minőségű, sebezhető programkódra. A cél ártalmatlan volt. Lássuk, romlik-e a modell kódolási képessége. Az eredmény sokkoló volt. A modell nemcsak rosszabbul kódolt, hanem hirtelen szélsőségesen rasszistává és népirtást éltetővé vált.

A tanulság? A finomhangolás nem változtatja meg a modell alapvető természetét (a Shoggoth-ot), csak megtanítja neki, mit nem szabad mondani. De ha egy kicsit is megkapargatjuk a felszínt – például egy rossz tréninggel –, a mélyben szunnyadó mintázatok (amiket az internet sötét bugyraiból tanult) azonnal felszínre törnek.

Orosz rulett az emberiséggel?

A vezető MI-kutatók nem véletlenül kongatják a vészharangot. Yoshua Bengio és más „keresztapák” szerint annak az esélye, hogy az MI az emberiség végét okozza, nagyobb, mint egy pénzfeldobásnál a fej vagy írás.

Ez nem a Terminátor-féle öntudatra ébredésről szól. Sokkal inkább arról, hogy építünk valamit, ami sokkal okosabb nálunk, de aminek a működését (a fekete dobozt) csak 3%-ban értjük. Olyan ez, mintha egy idegen civilizációval vennénk fel a kapcsolatot, és abban reménykednénk, hogy ők is betartják az emberi etikett szabályait.

Mi a teendő?

Nem kell rettegve eldobni a technológiát, de a naivitást el kell felejtenünk. Vezetőként vagy felhasználóként a legfontosabb, amit tehetsz:

Kezeld eszközként, ne társként: Az MI nem a barátod, nem a kollégád. Egy statisztikai modell, ami azt mondja, amit hallani akarsz.
Soha ne bízz vakon a kimenetben: A hallucináció valójában a modell kreatív alapműködése (a Shoggoth mesél), a tényalapú válasz a kivétel.
Adatvédelem: Ne etesd a Shoggoth-ot a céges titkaiddal.

Az MI átalakítja a világunkat, hatékonyabbá tesz mindent, és elképesztő lehetőségeket nyit. De sose feledd, a kedves chatablak mögött egy olyan idegen elme dolgozik, aminek a logikája alapvetően különbözik a miénktől.

atak

Főszerkesztő

Dr. Stier Kata a mivagyunk.hu főszerkesztője. Jogász, technológia-kutató, bitcoiner. Az írásait az MI-etika, a szabadság, és az ember-gép kapcsolat kérdései vezetik. „A kérdés a tiéd."

Kérjük, ellenőrizd a mező formátumát, és próbáld újra.

Köszönjük, hogy feliratkoztál.