Itt a Gemini 3.0 Pro, és okosabb, mint bármi, amit eddig láttál

Azt hitted, a ChatGPT-vel már elértük a csúcsot? A Google szerint még csak most melegítünk. Miközben a legtöbben még mindig csak alapvető kérdésekre használják a mesterséges intelligenciát, a techóriás csendben kiadta a Gemini 3.0 Pro-t, ami alapjaiban írja át a játékszabályokat. Ez már nem csak egy chatbot. Ez egy elemző, egy grafikus, egy videószerkesztő és egy kódoló zseni egyetlen felületbe gyúrva. Parker Prompts legújabb videójában darabokra szedte a rendszert, mi pedig mutatjuk, miért ez a 2026-os év legfontosabb eszköze.

Ha 2025 novembere óta nem léptél be a Google MI-felületére, akkor valószínűleg lemaradtál a technológiai iparág egyik legnagyobb ugrásáról. A Gemini 3.0 Pro nem csupán gyorsabb lett; „multimodális” szörnyeteggé vált, ami azt jelenti, hogy egyszerre lát, hall, olvas és beszél.Méghozzá olyan szinten, ami a versenytársakat (legyen szó a GPT-5.1-ről vagy a Claude Sonnet 4.5-ről) is zavarba hozza.

A „Gondolkodó” mód: Amikor az MI matekozni kezd

Sokan panaszkodtak eddig, hogy az MI „hallucinál”, vagyis magabiztosan mond butaságokat. A Gemini 3.0 Pro új „Thinking” (Gondolkodás) módja ezt a problémát orvosolja. A videóban láthattunk egy befektetési példát:

Opció A: 8% hozam évente.

Opció B: 12% hozam, de évi 200 dollár kezelési költség.

Kérdés: Melyik éri meg jobban 5 év alatt 5000 dolláros tőkével?

A régi modellek csak rávágtak volna valamit. A Gemini 3.0 Pro viszont megállt, lépésről lépésre levezette a kamatos kamatot, levonta a díjakat, és egy átlátható táblázatban prezentálta a győztest. Ez a fajta következtető képesség teszi alkalmassá a rendszert valós pénzügyi és üzleti döntések támogatására.

A mindent látó szem: Videóelemzés mesterfokon

Ez a funkció sokkoló. Feltöltesz egy videót, és a Gemini nemcsak „megnézi”, hanem szerkesztőként elemzi azt. A demóban a rendszer:

Fejezetekre bontotta a felvételt.
Kiemelte a kulcspillanatokat és az érzelmi csúcspontokat.
Konkrét javaslatokat tett a vágásra és a ritmus javítására.

Ez gyakorlatilag egy digitális vágóasszisztens, aki másodpercek alatt végez el órákig tartó munkát. Ugyanez igaz a képekre is: egy bonyolult üzleti dashboard (műszerfal) fotójából azonnal kinyeri az anomáliákat és a trendeket, mintha egy profi adatelemző ülne melletted.

A „Nano Banana Pro” visszatér: Tökéletes képek, végre

A Google legfejlettebb képgenerátora, a vicces nevű – de annál komolyabb tudású – Nano Banana Pro is a csomag része. Mi a nagy dobás? A szövegkezelés. Mindenki ismeri a fájdalmat, amikor az MI gyönyörű képet generál, de a felirat rajta valami olvashatatlan hieroglifa. A Nano Banana Pro ezzel leszámolt: a „YouTube thumbnail” demóban kristálytiszta, stílusos betűkkel írta ki a kért szöveget. Emellett a szerkesztési funkciók is szintet léptek. Egy napfényes fotóból egyetlen utasítással („moody cinematic night scene”) borongós, neonfényes éjszakai jelenetet varázsolt, megőrizve az eredeti kompozíciót.

Veo 3.1: Ahol a képek életre kelnek

A videógenerálás terén a Google a Veo 3.1 modellel robbantott. A legdurvább újítás a „natív hanggenerálás”. Amikor a videóban két ember beszélgetett egy kávézóban, a hangjukat, a háttérzajt és a szájmozgásukat (lip-sync) is az MI generálta – utómunka nélkül. Sőt, a rendszer képes állóképekből videót készíteni (pl. egy termékfotót forgó reklámanyaggá alakítani), vagy két kép között tökéletes átmenetet (morphing) létrehozni. Ez a marketingesek álma: statikus anyagokból mozgó, hangos hirdetések percek alatt.

NotebookLM: A személyes podcastod

A diákok és kutatók kedvence, a NotebookLM is megkapta a Gemini 3.0 Pro motorját. A funkció, amiért mindenki megőrül, az „Audio Overview”. Feltöltesz egy száraz, 50 oldalas kutatási anyagot vagy egy unalmas tankönyvet, és a rendszer generál belőle egy két szereplős, beszélgetős podcastot. A két MI-műsorvezető viccelődik, kérdéseket tesz fel egymásnak, és közérthetően magyarázza el a legbonyolultabb kvantumfizikai összefüggéseket is. Ez nem felolvasás; ez tanítás a javából.

Oktatás és kódolás: A jövő tanára

A Gemini 3.0 Pro nemcsak elmagyarázza a fizikát, hanem vizualizálja is. A videóban a „hajítás” fizikai jelenségét nemcsak szövegben írta le, hanem generált hozzá egy Python kódot, ami egy interaktív szimulációt futtatott le a szemünk előtt. Ez a fajta „aktív tanulás” – ahol a diák kérhet egy szimulációt, módosíthatja a paramétereket és láthatja az eredményt – forradalmasíthatja az oktatást. Ráadásul a diákoknak egy évig ingyenes a használat!.

Ne maradj le!

A Gemini 3.0 Pro nem csak egy újabb verziószám. Ez egy komplett eszköztár, ami kiváltja a képszerkesztőt, a videóvágót, az adatelemzőt és a magántanárt. A Google üzenete egyértelmű: az MI többé nem játék, hanem a munka és a tanulás alapvető motorja.

Mit tehetsz te?

Próbáld ki a „Live Mode”-ot a telefonodon! Irányítsd a kamerát egy kézzel rajzolt folyamatábrára, és kérd meg a Geminit, hogy keressen benne logikai hibákat. Az eredmény meg fog döbbenteni. További tippekért kövesd a mivagyunk.hu-t!

atak

Főszerkesztő

Kérjük, ellenőrizd a mező formátumát, és próbáld újra.

Köszönjük, hogy feliratkoztál.