Anthropic Opus 4.5: Chrome és Excel integráció az új modellben

Az Anthropic hétfőn bemutatta az Opus 4.5-öt, a 4.5-ös sorozat utolsó modelljét. Az új verzió áttörést hoz a kódolási benchmarkokban. Chrome és Excel integrációval érkezik, és olyan memóriakezelési újításokat tartalmaz, amelyek lehetővé teszik a megszakítás nélküli, „végtelen” chatbeszélgetéseket a fizetős felhasználók számára.

Új mérce a kódolási teljesítményben

Az Anthropic hétfőn jelentette be az Opus 4.5-öt, zászlóshajó modelljének legfrissebb verzióját. Az új modell a 4.5-ös sorozat utolsó tagja, a Sonnet 4.5 szeptemberi és a Haiku 4.5 októberi bemutatása után.

Az új Opus élvonalbeli teljesítményt nyújt számos benchmarkon, köztük kódolási teszteken (SWE-Bench és Terminal-bench), eszközhasználatban (tau2-bench és MCP Atlas), valamint általános problémamegoldásban (ARC-AGI 2, GPQA Diamond).

Különösen figyelemre méltó, hogy az Opus 4.5 az első modell, amely 80 százalék feletti eredményt ért el az SWE-Bench verified teszten, a kódolási képességek egyik legmegbecsültebb mércéjén.

Chrome és Excel – a gyakorlatban

Az Anthropic kiemelte az Opus számítógép-használati és táblázatkezelési képességeit. A modell bemutatásával párhuzamosan a vállalat szélesebb körben elérhetővé teszi a Claude for Chrome és a Claude for Excel termékeket. Ezek korábban csak pilot programban voltak elérhetők.

A Chrome-bővítmény minden Max felhasználó számára elérhető lesz. Az Excel-központú modell a Max, Team és Enterprise felhasználók számára válik elérhetővé.

Memóriakezelés újragondolva

Az Opus 4.5 jelentős memóriakezelési fejlesztéseket tartalmaz hosszú kontextusú műveletek esetén. Ez alapvető változásokat igényelt abban, ahogyan a modell kezeli a memóriáját.

„Vannak általános hosszú kontextus minőségi fejlesztések, amelyeket az Opus 4.5 tréningelésében végeztünk, de a kontextusablakok önmagukban nem lesznek elegendőek”

– mondta Dianne Na Penn, az Anthropic kutatási termékmenedzsment vezetője.

„A megfelelő részletek megjegyzése rendkívül fontos kiegészítője a hosszabb kontextusablaknak.”

Ezek a változások tették lehetővé a fizetős Claude-felhasználók régóta várt „végtelen chat” funkcióját is. Ez lehetővé teszi, hogy a beszélgetések megszakítás nélkül folytatódjanak, amikor a modell eléri a kontextusablakát. Ehelyett a modell tömöríti a kontextusmemóriát anélkül, hogy értesítené a felhasználót.

Ágensek irányítása ágensekkel

A fejlesztések jelentős része az úgynevezett ágensi használati esetekre összpontosít. Különösen olyan forgatókönyvekre, amelyekben az Opus vezető ágensként működik, és Haiku-alapú alágensek csoportját irányítja.

Ezeknek a feladatoknak a kezelése erős munkamemória-kezelést igényel. Itt mutatkozik meg igazán Penn által leírt memóriafejlesztések értéke.

„Itt válik igazán fontossá az olyan alapvető képesség, mint a memória”

– mondja Penn.

„Mert a Claude-nak képesnek kell lennie kódbázisok és nagy dokumentumok feltárására, és tudnia kell, mikor kell visszalépnie és újraellenőriznie valamit.”

Kiélezett verseny a csúcsmodellek között

Az Opus 4.5 kemény versennyel néz szembe más, nemrég kiadott élvonalbeli modellekkel. Leginkább az OpenAI GPT 5.1-gyel (megjelent november 12-én) és a Google Gemini 3-mal (megjelent november 18-án).

Vajon hogyan változtatják meg ezek az integrációk a munkavégzést a gyakorlatban? A Chrome és az Excel integráció azt jelenti, hogy a MI nem csak elméleti eszköz marad, hanem beépül a mindennapi munkafolyamatokba.

És ami talán ennél is érdekesebb: mit jelent az, amikor egy MI-modell „végtelen” memóriával dolgozik, és ágenseket irányít? Hol húzódik a határ a produktivitás és a függőség között?