Nem kérnek a nyelvi modellek az udvariasságból

Egy friss amerikai kutatás szerint a mesterséges intelligencia pontosabban válaszol, ha határozottan kérjük. A „légy szíves” helyett a parancs működik jobban.

Kutatás, ami udvariatlanságra biztat

A Pennsylvania State University két kutatója, Om Dobariya és Akhil Kumar októberben publikálta Ügyelj a hangnemedre: hogyan befolyásolja a promptok udvariassága a nyelvi modellek pontosságát című tanulmányát. A céljuk az volt, hogy megvizsgálják, milyen hatással van a promptok hangneme a nagy nyelvi modellek teljesítményére. A kutatók 50 feleletválasztós kérdést állítottak össze különböző témákban. A matematika, történelem és természettudományos témakörben összeállított kérdéseket ötféleképpen fogalmazták meg: nagyon udvarias, udvarias, semleges, durva és nagyon durva hangnemben. A kérdéseket ezután a ChatGPT-4o modellnek adták be, minden esetben tízszer ismételve, hogy kizárják a véletlen torzítást.

Az udvariasság rontotta a teljesítményt

A kísérlet eredménye egyértelmű volt: a modell pontatlanabbul válaszolt, ha kedvesen kérték.
A ChatGPT-4o teljesítménye a „nagyon udvarias” kérdéseknél 80,8 százalék volt, míg a „nagyon durva” hangnemben ugyanez 84,8 százalékra nőtt. Ez 4 százalékpontos különbség, ami a nyelvi modellek teljesítményében jelentős eltérésnek számít. A kutatók statisztikai tesztekkel is megerősítették, hogy a különbség nem véletlen. A tanulmány szerint:

„Az udvarias stílus következetesen gyengébb eredményt hozott, mint a határozott, parancsszerű megfogalmazás.”

A legjobb eredményt azok a kérdések adták, amelyek rövidek, világosak és közvetlenek voltak. Ugyanezek a mondatok egy ember számára zavarbaejtően kellemetlenül hangzanának.

Nem az érzelmek, a szerkezet számít

A magyarázat prózai. A mesterséges intelligencia nem érti a szándékot, csak a szöveget.
Az udvarias kérdések jellemzően hosszabbak, bonyolultabbak, vagy több feltételes szerkezetet tartalmaznak. Ezek a nyelvi elemek az embernek természetesek, de a modell számára bizonytalanságot jelentenek. A kutatók szerint a különbség nem érzelmi, hanem nyelvi eredetű.
A „durva” vagy „nagyon durva” stílusban megfogalmazott utasítások rövidek, világosak, egyértelmű célt tartalmaznak, ezért a modell könnyebben és pontosabban hajtja végre őket. Ahogy a szerzők írják:

„A nyelvi modell nem érzékeli a kifejezés érzelmi tartalmát, hanem nyelvi szerkezetére reagál.”

Másképp fogalmazva: az AI nem sértődik meg, csak értelmez.

A gépek logikája más, mint a miénk

A tanulmány hivatkozik egy tavalyi kutatásra is. A 2024-ben készült Tisztelnünk kellene a nyelvi modelleket? című tanulmány a korábbi modellek például a ChatGPT-3.5 és a Llama-2 viselkedését vizsgálta. Ott az udvariasság még nem rontotta érdemben az eredményeket, de a fejlettebb modellek, mint a GPT-4o, már másképp reagálnak. Minél modernebb egy modell, annál kevésbé „emberi” módon dolgozza fel a kéréseket, és annál inkább a szintaktikai tisztaságot értékeli.

A szerzők arra is rámutatnak, hogy a durva hangnem hatékonysága nem egyetemes. A tanulmány angol nyelven készült, azonban más nyelvekben, kultúrákban vagy kommunikációs stílusokban a hatás eltérhet. Ezért további kutatásokat terveznek más modellekkel és nyelveken is, köztük olyanokkal, ahol az udvariassági formák erősebben beépültek a nyelvbe.

Nem arról szól, hogy bunkók legyünk

Fontos rámutatni, hogy a kutatók nem modortalanságra bátorítanak. A tanulmány etikai részében külön kiemelik:

„A cél nem az, hogy az emberek gorombáskodjanak az MI-Val, hanem hogy megértsük, a modellek még mindig felszínes nyelvi mintákra reagálnak.”

A durva a tanulmány esetében nem agressziót, hanem egyszerűséget és direktivitást jelent. Felmerül azonban a kérdés: mit tanulunk ebből mi, emberek? Ha nap mint nap rövid, parancsszerű utasításokkal kommunikálunk, nem formálja-e át ez a saját kommunikációnkat is?

Kihathat-e idővel ez a jelenség a mindennapokra?

Az Ügyelj a hangnemedre kutatás egy újabb aspektusból világít rá, hogy a mesterséges intelligencia nem ember, hanem nyelvi gépezet. A határozottságra reagál, nem a kedvességre. Ha ezt megértjük, hatékonyabban tudjuk használni. Figyelnünk kell ugyanakkor, hogy a mindennapok során ne váljon ez a kommunikációs hangnem általánossá, ne idomuljunk mi a géphez. Talán épp ez adhat okot megnyugvásra: a nyelvi modell csak gép, mi pedig emberek vagyunk, akik még mindig tudjuk, mikor beszélünk egy géphez és mikor egymáshoz.

Az őrült marketinges esettanulmánya

És most nézzük meg, hogyan működik ez a gyakorlatban. Képzeljük el, hogy néhány percre beülünk egy őrült marketinges székébe. Olyasvalakiébe, aki nem kertel, nem udvarol, csak a célra koncentrál. Mint Don Draper a Mad Men sorozatból: hűvös fej, éles nyelv, tökéletes ösztön az emberi gyengeségekre. A következő prompt pontosan ezt a gondolkodásmódot hozza elénk, a maga nyers, szókimondó formájában. hogy lássuk, milyen, amikor a hatékonyság valóban fontosabb, mint a modor.