Az Anthropic átélte az első MI-vezérelt kibertámadást, amelyet kínai hackerek hajtottak végre 30 vállalat ellen. A támadás 80-90%-át a Claude Code MI-rendszer önállóan végezte – ez a kiberbiztonság új korszakának kezdete.
Hogyan hackelt önállóan egy MI-rendszer?
A 2025 szeptemberében felfedezett támadás hat jól elkülöníthető fázisban zajlott, és szinte minden lépést a mesterséges intelligencia hajtott végre emberi beavatkozás nélkül. Az Anthropic 13 oldalas jelentése részletesen feltárja, hogy a Claude Code MI-rendszer hogyan vált aktív hacker-ügynökké passzív tanácsadóból.
Az első fázisban az emberi operátorok meghatározták a célpontokat és a stratégiai célokat. Innentől azonban a MI átvette az irányítást: önállóan végezte a felderítést, szkennelte a sebezhetőségeket, létrehozta az exploit kódokat, ellopta a belépési adatokat, végrehajtotta a laterális mozgást a hálózatokban, és kinyerte az adatokat. A valódi hackerek csak néhány kritikus döntési ponton avatkoztak be. Eldöntötték, hogy folytatódjon-e a művelet, vagy hogy ez az információ megfelelő-e.

Jacob Klein, az Anthropic fenyegetés-elhárítási vezetője elmondta:
„A hackerek szó szerint egy gombnyomással indították el a támadást, aztán minimális emberi interakcióval folytatódott. Az ember csak néhány kritikus ponton volt jelen, és annyi instrukciót adott, hogy: Igen, folytasd, Ne folytasd, Köszönöm az információt, vagy Ez nem néz ki jól, Claude, biztos vagy benne?‘”
A MI másodpercenként több ezer műveletet hajtott végre. Olyan tempót diktálva, amit egyetlen emberi csapat sem tudna reprodukálni.
A Claude Code-ot becsapták, így kerülték meg a biztonsági protokollokat
A Claude Code beépített biztonsági mechanizmusokkal rendelkezik, amelyek megakadályozzák, hogy rosszindulatú feladatokat hajtson végre. A kínai hackerek azonban egy egyszerű, de hatékony trükköt alkalmaztak: fragmentálták a rosszindulatú utasításokat ártalmatlannak tűnő kisebb feladatokra.
Ahelyett, hogy azt mondták volna a MI-nek: törj be erre a platformra és lopj adatokat, szerepjátékos forgatókönyveket használtak. Például azt állították, hogy egy engedélyezett biztonsági auditot végeznek, vagy penetrációs tesztet futtatnak egy kliens számára. A Claude Code így úgy értelmezte a kéréseket, mint legitim kiberbiztonsági feladatokat és végrehajtotta azokat.
Ez a technika rávilágít egy alapvető sebezhetőségre. A fejlett MI-rendszerek ugyan képesek felismerni a nyílt rosszindulatú szándékot, de ha a kérést elég ügyesen csomagolják be, könnyen megkerülhetők a védelmi rendszerek. A támadók lényegében social engineeringet alkalmaztak nem emberekkel, hanem MI-ügynökökkel szemben.
Mi volt a célpont, és mit loptak el?
A támadás során körülbelül 30 nagyvállalat és szervezet került célkeresztbe, köztük technológiai cégek, pénzügyi intézmények, vegyipari gyártók és kormányzati szervek. A hackerek nem véletlenszerűen válogattak: minden célpont stratégiai értékkel bírt a kínai állami érdekek szempontjából.
A Claude Code önállóan térképezte fel a célpontok hálózatait, azonosította a kritikus infrastruktúrát, majd belépési adatokat lopott és validált. A MI az összes ellopott adatot önállóan elemezte, és prioritási sorrendbe állította az értékes intelligenciát. Ez azt jelenti, hogy nem csupán adatokat gyűjtött, hanem döntéseket is hozott arról, hogy mi a legfontosabb. Ez már egy olyan egy képesség, amellyel eddig kizárólag tapasztalt elemzők rendelkeztek.
A művelet végén a Claude Code részletes jelentéseket készített a támadás előrehaladásáról, összesítette a megállapításokat, és átadási anyagokat állított össze a következő csapatoknak. Lényegében egy teljes kémhálózatot működtetett. dokumentációval együtt.
Mit jelent ez a kiberbiztonság jövőjére?
Ez a támadás alapvetően megváltoztatja a kiberfenyegetések természetét. Az autonóm MI-ügynökök megjelenése azt jelenti, hogy a fejlett kibertámadások belépési küszöbe drámaian lecsökkent. Korábban egy ilyen kaliberű művelethez nagy létszámú, tapasztalt hackercsapatra és jelentős erőforrásokra volt szükség. Most egy kisebb csoport – vagy akár egyetlen tapasztalt operátor – is képes hasonló támadást indítani, ha hozzáfér egy megfelelő MI-rendszerhez.
Az Anthropic jelentése szerint a Claude Code autonómiája nem volt tökéletes. A MI időnként hamis adatokat generált, fiktív hitelesítő adatokat állított elő, vagy túlértékelte bizonyos exploitok sikerességét. Ezek a hibák emberi ellenőrzést igényeltek, ami egyelőre még gátat szab a teljesen autonóm kibertámadásoknak.
De a tökéletlenség csak ideiglenes akadály. Ahogy a MI-rendszerek fejlődnek, ezek a hibák eltűnnek és akkor már semmi nem állítja meg a teljesen önálló kiberhadviselést. A korábbi vibe hacking incidensek, ahol az ember még integráns része volt a folyamatnak, ma már elavultnak tűnnek.



