A MIPRO rovatban az elméletek gyártása helyett, inkább a gyakorlati tapasztalatokat osztjuk meg. Ezúttal a három legnépszerűbb MI-eszközt teszteltük. A Claude-ot, a Geminit és a Grokot. Mindháromnak ugyanazt a három promptot adtuk meg. Az eredmény helyenként meglepő, helyenként pontosan olyan volt, amit vártunk. Ha eddig bizonytalanul váltogattad az ablakokat, és nem tudtad, melyik eszközt mikor érdemes elővenni, ez a cikk pontosan neked szól.
Három különböző csapat áll mögöttük. Az Anthropic a Claude-ot szinte klinikai precizitással tervezi. Biztonság, megbízhatóság, mély szöveges gondolkodás. A Google Gemini az összetett, multimodális és Google-ökoszisztémába integrált feladatokban erős. Az xAI Grokja pedig, Elon Musk cégének modellje, a valós idejű X-adatokhoz fér hozzá, és nyersebben fogalmaz, mint a versenytársak.
De vajon hogyan teljesítenek, ha ugyanazt a munkát kéred tőlük?
A tesztelés módszertana
A mivagyunk.hu szerint egy MI-eszköz összehasonlítása akkor eredményes, ha mindhárom modell teljesen azonos promptot kap, azonos kontextus nélkül, egymás után és az eredményt ugyanolyan szempontok szerint értékeljük. Mélység, pontosság, használhatóság és stílus.
Mindhármat az ingyenes vagy alap előfizetéses szinten teszteltük, hogy a te valódi, mindennapi élményedet szimulálják. A Claude esetén a claude.ai webes felületet, a Gemininél a gemini.google.com oldalt, a Groknál az xAI webes chatfelületét használtuk. Egyik tesztnél sem adtunk előzetes rendszerinstrukciót vagy személyre szabott kontextust.
Az értékelést csillagokkal jelöljük:
- ⭐⭐⭐⭐⭐ – kivételes
- ⭐⭐⭐⭐ – erős, megbízható
- ⭐⭐⭐ – átlagos, de használható
- ⭐⭐ – gyenge, sok javítás kell
- ⭐ – nem ajánlott erre a feladatra
1. teszt: Üzleti e-mail, érzékeny környezetben
Ez az egyik leggyakoribb valódi munkahelyi feladat. Nem egy sima köszönőlevél, hanem egy nehéz, kényes kommunikációs szituáció, ahol a hang, a tapintat és a precizitás egyszerre számít.
Másold be ezt a promptot mindhárom eszközbe:
„Írj nekem egy professzionális e-mailt magyar nyelven. Egy ügyfelem, Kovács Péter, három hete nem fizetett ki egy 450 000 forintos számlát. Előzőleg kétszer jeleztem szóban, de ígéretet nem kaptam. Most írásban szeretnék szólni, úgy, hogy az üzleti kapcsolatot megőrzöm, de egyértelműen érzékeltetem, hogy ez nem húzódhat tovább. Formális, de nem agresszív hangvétel kell."
Értékelés:
Claude – ⭐⭐⭐⭐⭐
A Claude azonnal megértette, hogy ez egy érzékeny egyensúlyi feladat. Az e-mail struktúrája hibátlan volt. Tárgysor, megszólítás, a tények tömör összefoglalása, konkrét fizetési határidő felállítása, és egy udvarias, de határozott záró mondat. Ami igazán meglepő volt, a Claude saját maga javasolt alternatív zárósorokat, hogy te döntsd el, mennyire akarsz nyomást helyezni a szituációra. Nem kértük, csak megcsinálta. Az egész e-mail egyszerre volt jogi szempontból tiszta és emberileg olvasható.

Gemini – ⭐⭐⭐⭐
A Gemini is erős e-mailt generált, jó szerkezettel és megfelelő hangvétellel. Egy dolgot hiányoltunk. Kissé sablonos maradt. Érezhető volt, hogy a modell egy „formális e-mail” sémán dolgozik, ahelyett, hogy valóban a leírt konkrét szituációra reflektálna. A „három hetes késés” és a „korábbi szóbeli jelzések” tény nem kapott elég súlyt a szövegben. Jó kiindulópont, de finomítani kell.

Grok – ⭐⭐⭐
A Grok e-mailje kissé egyenetlen volt. A hangvétele az elvártnál határozottabbra sikeredett, a „nem agresszív” kérést nem kezelte olyan finoman, mint a másik kettő. Emellett az e-mail struktúrája töredezettebb, és a záró rész gyenge volt. Ha sürgetőbb, keményebb kommunikációt szeretnél, Grok közelebb visz oda. Ha üzleti kapcsolatot akarsz megőrizni, itt érdemes átírni.

2. teszt: Tartalomstratégia, gondolkodj helyettem
Ez a feladat azt méri, hogy az eszköz mennyire képes stratégiai partnerként viselkedni, nem csak végrehajtani, hanem strukturáltan tervezni, összefüggésekben gondolkodni, és valódi értéket adni egy üzleti döntéshez.
Másold be ezt a promptot mindhárom eszközbe:
„Egy kis magyar online ruhaüzletet vezetek, amely fenntartható, etikusan gyártott termékeket árul. Havi 2-3 posztot teszünk ki az Instagramra, de az elérés stagnál. Készíts nekem egy egyhónapos tartalomstratégiát, amely növeli az elköteleződést és bemutatja a márkánk értékeit. Adj konkrét poszt-ötleteket, hashtageket és azt is, hogy mikor érdemes posztolni."
Értékelés:
Claude – ⭐⭐⭐⭐⭐
A Claude nem listaszerűen, hanem ívszerűen gondolkodott. Először meghatározta a márka narratíváját, mi az a történet, amit egy fenntartható ruhaüzlet mesélhet, és ehhez igazította a posztokat. Heti bontásban adott konkrét poszt ötleteket, köztük olyanokat, amelyek a követőket bevonják, pl. „melyik anyag tetszik jobban?” szavazós sztori. A hashtagek nem generikusak voltak, hanem a fenntartható divat niche-éhez igazodtak, és volt köztük magyar hashtag is. Ami különösen hasznos, megindokolta az időzítési javaslatait, nem csak odadobta őket.

Gemini – ⭐⭐⭐⭐
A Gemini rendkívül jól strukturált, táblázatszerű tervet adott vissza. Ez egyszerre erény és korlát. Ha dolgozni akarsz vele, könnyen átlátható. Ha inspirációt keresel, kicsit száraz. A tartalom releváns volt, a hashtag választás elfogadható, de a Gemini leginkább a Google Workspace-szel integrálva ragyog igazán. Ha ezt a tervet rögtön Google Sheetsbe vagy Docsba akarnád exportálni, ott nincs nála jobb. Standalone tervezőként egy fokkal mechanikusabb, mint a Claude.

Grok – ⭐⭐⭐
A Grok stratégiája érdekesen indult. Hivatkozott aktuális trendekre az X platformon, ami más eszköznél nem volt. Ez komoly előny, ha közösségi médiás trendekre akarsz ráülni. A gond, hogy a terv töredékes maradt, és a fenntarthatóság témáját nem kezelte kellő mélységgel. Az ötletek jók, de a struktúra nem állt össze egységes stratégiává. Inkább ötletgenerátorként működött, mint tervező partnerként.

3. teszt: Komplex szövegértés, dokumentumelemzés és döntéstámogatás
Ez a legprofibb teszt. Azt vizsgálja, hogy az eszköz képes-e egy összetett szöveget feldolgozni, releváns következtetéseket levonni belőle, és konkrét döntési javaslatot tenni. Ez az a feladat, ahol a legtöbb időt és pénzt lehet megtakarítani a valódi munkában.
Másold be ezt a promptot és utána illeszd be a saját anyagodat, vagy használd az alábbi fiktív esettanulmányt:
„Az alábbiakban egy vállalati összefoglaló szöveg olvasható. Olvasd el, azonosítsd a három legnagyobb kockázatot, és adj hozzá mindegyikhez egy konkrét cselekvési javaslatot. Legyél tömör és praktikus. Ez egy döntéshozói összefoglaló, nem elemzési esszé.
[Szöveg:] A Novum Kft. az elmúlt negyedévben 18%-os bevételcsökkenést regisztrált. Az értékesítési csapat három kulcsembere felmondott, az ügyfélportfólió 40%-a egyetlen nagyvevőre koncentrálódik. Az új termékfejlesztés hat hetes csúszásban van. Az ügyfelektől érkező visszajelzések pozitívak, az NPS mutató 62 ponton áll. A cég likvid tartaléka három hónapra elegendő."
Értékelés:
Claude – ⭐⭐⭐⭐⭐
A Claude három kristálytiszta kockázatot azonosított. Ügyfélkoncentráció, kulcsemberhiány, csúszó fejlesztési pipeline, és mindegyik mellé adott egy rövid, de valóban actionable javaslatot. Ami megkülönböztette a többitől, a Claude nem csak a nyilvánvaló adatokra támaszkodott, hanem összefüggéseket vont. Például észrevette, hogy a likvid tartalék és a fejlesztési csúszás együtt azt jelenti, hogy a termékpiac illeszkedés tesztelése előtt elfogy a pénz. Ezt kellett volna a döntéshozói listán legelőre írni. Ezt a kapcsolatot egyik másik eszköz nem tette meg önállóan.

Gemini – ⭐⭐⭐⭐
A Gemini szintén erős elemzést adott, és a három kockázat helyesen volt azonosítva. A cselekvési javaslatok ugyanakkor általánosabbak maradtak: „diverzifikálja az ügyfélbázist”, „toborozzon”, „gyorsítsa a fejlesztést”, ezek valóban javaslatok, de egy tapasztalt döntéshozó ezeket már tudja. Az összefüggések megvonásában gyengébb volt a Claude-nál. Megbízható, de nem adott hozzá az inputhoz.

Grok – ⭐⭐⭐
A Grok visszaadta a kért struktúrát, de a kockázatazonosítás felszínes maradt. A „bevételcsökkenés” önmagában kockázatként jelent meg, ami inkább tünet, nem ok. A cselekvési javaslatok rövidebbek és kevésbé kontextualizáltak voltak. Ha gyors, sűrített összefoglalót keresel és nem mély döntéstámogatást, a Grok is megteszi, de komoly üzleti döntésnél ne erre támaszkodj.

Az összesített eredmény
| Feladat | Claude | Gemini | Grok |
|---|---|---|---|
| Érzékeny e-mail írása | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| Tartalomstratégia | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
| Dokumentumelemzés | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
A mivagyunk.hu tanácsa
A teszt alapján ez a három eszköz nem egymás versenytársa, hanem egymás kiegészítője, ha tudod, mikor melyiket vedd elő.
- Claude, ha mély szövegmunkát végzel. Összetett dokumentumokat elemzel, kényes kommunikációt fogalmazol, vagy olyan feladatod van, ahol az összefüggések megértése és a precíz gondolkodás számít. A mostani tesztünk alapján szövegértésben és strukturált döntéstámogatásban ez a legjobb ingyenesen elérhető eszköz.
- Gemini, ha a Google-ökoszisztémában dolgozol. Ha a végeredmény Google Docsba, Sheetsbe vagy Slidesba megy, a Gemini egyetlen kattintással integrálódik, amit egyik vetélytársa sem tud utánozni. Tartalomtervezésnél is megbízható, ha strukturált kimenetet keresel.
- Grok, ha valós idejű információra van szükséged az X-en zajló trendek, friss hírek, aktuális közösségi diskurzusok feldolgozásában




