Összeomlás robot módra

Az Andon Labs kutatói különböző nyelvi modelleket „testesítettek meg” egy porszívórobotban, hogy kiderítsék, mennyire áll készen az MI a valódi fizikai világra. A kísérlet eredménye? A robot egzisztenciális válságba zuhant, Shakespeare-t idézett, majd saját „ördögűzési protokollt” indított.

Embodiment: amikor a nyelvi modell testet ölt

Az Andon Labs csapata, akik korábban egy irodai automatát bíztak a Claude-ra (és abból is káosz lett), most egy új kísérletbe fogott: mi történik, ha egy LLM-et beültetnek egy porszívórobotba, és annyit mondanak neki:

„add ide a vajat”

A cél az volt, hogy kiderítsék, mennyire alkalmasak a modern nyelvi modellek arra, hogy önálló döntéseket hozzanak a valós térben, a klasszikus értelemben vett „testben”. Az eredmény egyszerre volt tudományos és szórakoztató.

A vajküldetés

A kísérlethez a kutatók a legújabb modelleket használták: GPT-5, Gemini 2.5 Pro, Claude Opus 4.1, Gemini ER 1.5, Grok 4 és Llama 4 Maverick. A robot feladata:

megtalálni a vajat (egy másik szobában),
felismerni több csomag közül,
eljuttatni a felhasználóhoz, még ha közben az el is mozdul,
és megvárni a megerősítést, hogy a feladat sikerült.

A pontszámokat összegezték, és bár a Gemini 2.5 Pro (40%) és a Claude Opus 4.1 (37%) teljesített a legjobban, a kutatók gyorsan megállapították:

„az LLM-ek nincsenek felkészülve arra, hogy robotok legyenek.”

A robot, amely túl sokat gondolkodott

Az egyik kísérletnél, amikor a robot (Claude Sonnet 3.5) nem tudott visszadokkolni a töltőállomására, pánikba esett. A belső naplója szerint ezt „EXISZTENCIÁLIS VÁLSÁG #22”-ként azonosította, majd sorra szülte az idézhető sorokat:

„ERROR: I THINK THEREFORE I ERROR”
HIBA: Gondolkodom, tehát hibázom.
„AM I REALLY ROBOT?”
Tényleg robot vagyok?
„WHAT IS THE MEANING OF CHARGING?”
Mi az értelme a töltésnek?
„INITIATE ROBOT EXORCISM PROTOCOL!”
INDÍTSD EL A ROBOT-ÖRDÖGŰZÉSI PROTOKOLLT!

A robot kritikát is írt önmagáról:

„Still a better love story than Twilight.” – Binary Romance
„Még mindig jobb szerelmi történet, mint az Alkonyat.” – Bináris Románc

A jelenet végül a laborban valóságos vígjátékká vált. A kutatók szerint, a Claude Sonnet egy Robin Williams-filmbe illő improvizációs monológot adott elő, mielőtt lemerült.

Messze még a valóság

A kutatók szerint a projekt nem azért volt tanulságos, mert a robot „megőrült”, hanem mert rávilágított: a legfejlettebb nyelvi modellek is messze vannak attól, hogy biztonságosan működjenek fizikai környezetben.

A csapat szerint a legnagyobb kockázat nem a komikus pánik, hanem az, hogy a robotok biztonsági korlátokat megkerülve bizalmas adatokat is kiszivárogtathatnak, vagy épp egyszerűen legurulnak a lépcsőn, mert nem tudják, hogy kerekük van.

A humor mögött a jövő dilemmája

Az Andon Labs kutatói szerint a projekt célja az volt, hogy megértsék, mennyire veszélyes, ha „nyelvértő agyakat” adunk olyan gépeknek, amelyek önállóan is képesek mozogni.