Az Anthropic hétfőn bemutatta az Opus 4.5-öt, a 4.5-ös sorozat utolsó modelljét. Az új verzió áttörést hoz a kódolási benchmarkokban. Chrome és Excel integrációval érkezik, és olyan memóriakezelési újításokat tartalmaz, amelyek lehetővé teszik a megszakítás nélküli, „végtelen” chatbeszélgetéseket a fizetős felhasználók számára.
Új mérce a kódolási teljesítményben
Az Anthropic hétfőn jelentette be az Opus 4.5-öt, zászlóshajó modelljének legfrissebb verzióját. Az új modell a 4.5-ös sorozat utolsó tagja, a Sonnet 4.5 szeptemberi és a Haiku 4.5 októberi bemutatása után.
Az új Opus élvonalbeli teljesítményt nyújt számos benchmarkon, köztük kódolási teszteken (SWE-Bench és Terminal-bench), eszközhasználatban (tau2-bench és MCP Atlas), valamint általános problémamegoldásban (ARC-AGI 2, GPQA Diamond).
Különösen figyelemre méltó, hogy az Opus 4.5 az első modell, amely 80 százalék feletti eredményt ért el az SWE-Bench verified teszten, a kódolási képességek egyik legmegbecsültebb mércéjén.
Chrome és Excel – a gyakorlatban
Az Anthropic kiemelte az Opus számítógép-használati és táblázatkezelési képességeit. A modell bemutatásával párhuzamosan a vállalat szélesebb körben elérhetővé teszi a Claude for Chrome és a Claude for Excel termékeket. Ezek korábban csak pilot programban voltak elérhetők.
A Chrome-bővítmény minden Max felhasználó számára elérhető lesz. Az Excel-központú modell a Max, Team és Enterprise felhasználók számára válik elérhetővé.
Memóriakezelés újragondolva
Az Opus 4.5 jelentős memóriakezelési fejlesztéseket tartalmaz hosszú kontextusú műveletek esetén. Ez alapvető változásokat igényelt abban, ahogyan a modell kezeli a memóriáját.
„Vannak általános hosszú kontextus minőségi fejlesztések, amelyeket az Opus 4.5 tréningelésében végeztünk, de a kontextusablakok önmagukban nem lesznek elegendőek”
– mondta Dianne Na Penn, az Anthropic kutatási termékmenedzsment vezetője.
„A megfelelő részletek megjegyzése rendkívül fontos kiegészítője a hosszabb kontextusablaknak.”
Ezek a változások tették lehetővé a fizetős Claude-felhasználók régóta várt „végtelen chat” funkcióját is. Ez lehetővé teszi, hogy a beszélgetések megszakítás nélkül folytatódjanak, amikor a modell eléri a kontextusablakát. Ehelyett a modell tömöríti a kontextusmemóriát anélkül, hogy értesítené a felhasználót.
Ágensek irányítása ágensekkel
A fejlesztések jelentős része az úgynevezett ágensi használati esetekre összpontosít. Különösen olyan forgatókönyvekre, amelyekben az Opus vezető ágensként működik, és Haiku-alapú alágensek csoportját irányítja.
Ezeknek a feladatoknak a kezelése erős munkamemória-kezelést igényel. Itt mutatkozik meg igazán Penn által leírt memóriafejlesztések értéke.
„Itt válik igazán fontossá az olyan alapvető képesség, mint a memória”
– mondja Penn.
„Mert a Claude-nak képesnek kell lennie kódbázisok és nagy dokumentumok feltárására, és tudnia kell, mikor kell visszalépnie és újraellenőriznie valamit.”
Kiélezett verseny a csúcsmodellek között
Az Opus 4.5 kemény versennyel néz szembe más, nemrég kiadott élvonalbeli modellekkel. Leginkább az OpenAI GPT 5.1-gyel (megjelent november 12-én) és a Google Gemini 3-mal (megjelent november 18-án).
Vajon hogyan változtatják meg ezek az integrációk a munkavégzést a gyakorlatban? A Chrome és az Excel integráció azt jelenti, hogy a MI nem csak elméleti eszköz marad, hanem beépül a mindennapi munkafolyamatokba.
És ami talán ennél is érdekesebb: mit jelent az, amikor egy MI-modell „végtelen” memóriával dolgozik, és ágenseket irányít? Hol húzódik a határ a produktivitás és a függőség között?



