Egy új kutatás kimutatta, hogy ha a nagy nyelvi modelleket alacsony minőségű, de nagy elérést generáló közösségi médiás tartalommal etetik, az csökkenti a „kognitív képességeiket”. Magyarul: az MI is elbutul, ha túl sokat görget.
Az MI-modellek talán mégis hasonlítanak az emberekre
Egy új kutatás, amelyet a Texasi Egyetem (Austin), a Texas A&M és a Purdue Egyetem kutatói végeztek, kimutatta: ha a nagy nyelvi modelleket népszerű, de gyenge minőségű közösségimédia-tartalmakkal „etetik”, egyfajta „agylágyulást” tapasztalnak. Olyasmit, amit bárki felismer, aki valaha is túl sok időt töltött doomscrollolással az X-en vagy a TikTokon.
„Olyan korban élünk, amikor az információ gyorsabban nő, mint a figyelemünk és a legtöbb tartalom nem az igazságot vagy a mélységet szolgálja, hanem a kattintásokat,”
– mondja Junyuan Hong, a Szingapúri Nemzeti Egyetem leendő adjunktusa, aki a kutatásban még a Texasi Egyetemen vett részt doktoranduszként.
„Felmerült bennünk a kérdés: mi történik, ha az MI-t is ugyanezzel a szeméttel etetjük?”
Hong és kollégái különböző szövegtípusokat adtak két nyílt forráskódú nagy nyelvi modellnek az előtréning során. Azt vizsgálták, mi történik akkor, ha a modellek étrendjét olyan közösségimédia-posztok alkotják, amelyek rendkívül „bevonzóak”, vagyis sok megosztást kapnak. Illetve olyan szövegek, amelyekben szenzációhajhász, túlpörgetett kifejezések szerepelnek, mint például „hűha”, „nézd” vagy „csak ma”.
Az MI agylágyulás tényleg létezik
A kutatók különböző tesztekkel vizsgálták, hogyan hat ez a „szeméttel teli” közösségimédia-diéta két nyílt forráskódú modellre: a Meta Llama-jára és az Alibaba Qwen-jére.
Az eredmény: a modellek, amelyek alacsony minőségű, kattintásvadász szövegeket kaptak, egyfajta mesterséges agylágyulást mutattak. Csökkent a következtetési képességük, romlott a memóriájuk, sőt, két különböző mérés szerint kevésbé lettek „etikusan hangoltak”, miközben a pszichopátiás jegyek erősödtek.
A jelenség kísértetiesen hasonlít az embereknél megfigyelt mintázatokra. A kutatások szerint a gyenge minőségű online tartalom rontja az emberek kognitív képességeit is.
Nem véletlen, hogy az Oxford Dictionary 2024-ben az „agylágyulás” (brain rot) kifejezést választotta az év szavának.
Hong szerint az eredmények az MI-ipar számára is figyelmeztetőek, mert sok fejlesztő azt feltételezi, hogy a közösségimédia-posztok jó tanítóadatot jelentenek.
„A virális, figyelemfelkeltő tartalomra épített tréning elsőre úgy tűnhet, mintha egyszerűen növelnénk az adatmennyiséget” – mondja. – „Valójában viszont lassan szétmarja az érvelési logikát, az etikai érzéket és a hosszú távú figyelmet.”
Különösen aggasztó, hogy az MI-k mostanra maguk is egyre több közösségimédia-tartalmat generálnak, amelyek jellemzően szintén az elérésre vannak optimalizálva. A kutatók azt is kimutatták, hogy az alacsony minőségű tartalommal „megfertőzött” modellek később már nem javíthatók könnyen újratréninggel.
Az eredmények arra is rámutatnak, hogy a közösségi platformok köré épülő MI-rendszerek – például a Grok – minőségi problémákkal küzdhetnek, ha a felhasználók által generált posztokat válogatás nélkül használják fel tanításra.
„Ahogy egyre több MI-termékű zagyvaság terjed a közösségi médiában, azzal együtt szennyeződik az az adat, amiből a jövő modellei tanulni fognak” – figyelmeztet Hong. – „És ami a legijesztőbb: ha ez a fajta brain rot egyszer beindul, a későbbi tiszta tréning sem tudja teljesen helyrehozni.”
