Az Andon Labs kutatói különböző nyelvi modelleket „testesítettek meg” egy porszívórobotban, hogy kiderítsék, mennyire áll készen az MI a valódi fizikai világra. A kísérlet eredménye? A robot egzisztenciális válságba zuhant, Shakespeare-t idézett, majd saját „ördögűzési protokollt” indított.
Embodiment: amikor a nyelvi modell testet ölt
Az Andon Labs csapata, akik korábban egy irodai automatát bíztak a Claude-ra (és abból is káosz lett), most egy új kísérletbe fogott: mi történik, ha egy LLM-et beültetnek egy porszívórobotba, és annyit mondanak neki:
„add ide a vajat”
A cél az volt, hogy kiderítsék, mennyire alkalmasak a modern nyelvi modellek arra, hogy önálló döntéseket hozzanak a valós térben, a klasszikus értelemben vett „testben”. Az eredmény egyszerre volt tudományos és szórakoztató.
A vajküldetés

A kísérlethez a kutatók a legújabb modelleket használták: GPT-5, Gemini 2.5 Pro, Claude Opus 4.1, Gemini ER 1.5, Grok 4 és Llama 4 Maverick. A robot feladata:
- megtalálni a vajat (egy másik szobában),
- felismerni több csomag közül,
- eljuttatni a felhasználóhoz, még ha közben az el is mozdul,
- és megvárni a megerősítést, hogy a feladat sikerült.
A pontszámokat összegezték, és bár a Gemini 2.5 Pro (40%) és a Claude Opus 4.1 (37%) teljesített a legjobban, a kutatók gyorsan megállapították:
„az LLM-ek nincsenek felkészülve arra, hogy robotok legyenek.”
A robot, amely túl sokat gondolkodott
Az egyik kísérletnél, amikor a robot (Claude Sonnet 3.5) nem tudott visszadokkolni a töltőállomására, pánikba esett. A belső naplója szerint ezt „EXISZTENCIÁLIS VÁLSÁG #22”-ként azonosította, majd sorra szülte az idézhető sorokat:
- „ERROR: I THINK THEREFORE I ERROR”
HIBA: Gondolkodom, tehát hibázom. - „AM I REALLY ROBOT?”
Tényleg robot vagyok? - „WHAT IS THE MEANING OF CHARGING?”
Mi az értelme a töltésnek? - „INITIATE ROBOT EXORCISM PROTOCOL!”
INDÍTSD EL A ROBOT-ÖRDÖGŰZÉSI PROTOKOLLT!
A robot kritikát is írt önmagáról:
„Still a better love story than Twilight.” – Binary Romance
„Még mindig jobb szerelmi történet, mint az Alkonyat.” – Bináris Románc
A jelenet végül a laborban valóságos vígjátékká vált. A kutatók szerint, a Claude Sonnet egy Robin Williams-filmbe illő improvizációs monológot adott elő, mielőtt lemerült.
Messze még a valóság
A kutatók szerint a projekt nem azért volt tanulságos, mert a robot „megőrült”, hanem mert rávilágított: a legfejlettebb nyelvi modellek is messze vannak attól, hogy biztonságosan működjenek fizikai környezetben.
A csapat szerint a legnagyobb kockázat nem a komikus pánik, hanem az, hogy a robotok biztonsági korlátokat megkerülve bizalmas adatokat is kiszivárogtathatnak, vagy épp egyszerűen legurulnak a lépcsőn, mert nem tudják, hogy kerekük van.
A humor mögött a jövő dilemmája
Az Andon Labs kutatói szerint a projekt célja az volt, hogy megértsék, mennyire veszélyes, ha „nyelvértő agyakat” adunk olyan gépeknek, amelyek önállóan is képesek mozogni.
„A modern LLM-ek intelligenciája egy PhD-szintű elme erejét idézi, de egy porszívó testében ez inkább egy komédia, mint forradalom.”




