Gemini képfelismerés: ezeket tudja, amikre nem számítottam

A Google DeepMind kutatásai szerint a Gemini Ultra modell a vizuális benchmarkok 90%-ában felülmúlja az emberi átlagot, ami alapjaiban írja felül a gépi látásról alkotott eddigi elképzeléseinket. Ez a technológiai ugrás nem csupán a pixelek felismerését jelenti, hanem a kontextuális összefüggések olyan mély szintű értelmezését, amely korábban elképzelhetetlen volt.

Gemini képfelismerés: ezeket tudja, amikre nem számítottam

Hogyan olvassa a Gemini a vizuális káoszt?

Néhány hete egy kaotikus fejlesztői brainstorming után lefotóztam a nyilakkal, félig letörölt kóddal és kusza jegyzetekkel teli fehértáblát. Bár kételkedtem benne, feltöltöttem a Gemini 1.5 Pro-ba, amely másodpercek alatt strukturált dokumentummá rendezte és sorrendbe állította a projekt mérföldköveit.

Ez a folyamat rávilágított arra, hogy a modell képességei messze túlmutatnak az egyszerű alakzatfelismerésen, hiszen a rendszer a következőket hajtotta végre:

- Felismerte a kézzel írt, gyakran elmosódott technikai rövidítéseket és kontextusba helyezte azokat.

- Értelmezte a nyilak irányát, és ebből egy koherens folyamatábrát vázolt fel a szoftveres architektúráról.

- Kiszűrte a táblán maradt irreleváns firkákat, amelyeket a korábbi megbeszélések során hagytunk ott.

- Logikai kapcsolatot teremtett a különböző színekkel írt megjegyzések és a fő folyamatok között.

- Javaslatot tett a vázlatban szereplő hiányzó lépésekre, kiegészítve a fejlesztési terv logikai réseit.

Döbbenetes volt látni, ahogy a neurális hálózat felismeri a kézírásos jegyzeteket és kontextusba helyezi azokat a korábbi szoftverarchitektúráról szóló beszélgetéseinkkel. Ez a szintű vizuális logika messze túlmutat a hagyományos optikai karakterfelismerés keretein, hiszen itt a szemantikai értelmezés dominált a puszta alakzatfelismerés felett. A rendszer nem csupán látott, hanem értett is, ami alapjaiban változtatja meg a napi munkafolyamatokat és az adatrögzítés módszertanát a modern irodai környezetben.

A natív multimodalitás technológiai háttere

A korábbi MI-modellek gyakran külön modulokból álltak, például egy látórendszerből és egy nyelvi modellből. A Google Gemini ezzel szemben natívan multimodális: betanításkor egyszerre dolgoz fel szöveget, képet, videót és hangot, és nem alakítja a képet szöveggé, hanem vizuális tokenekkel dolgozik. Transzformátor-alapja kiterjesztett figyelemmechanizmussal keresztreferenciákat hoz létre a vizuális elemek és a tudás között.

A technológia kifinomultságát jól jelzi, hogy a rendszer milyen módon kezeli a komplexitást:

- A pixeladatokat azonnal matematikai vektorokká alakítja, amelyek hordozzák a tárgyak tulajdonságait.

- Képes párhuzamosan elemezni több ezer képkockát egyetlen videofájlban a kontextus elvesztése nélkül.

- A kereszt-modális tanulás révén a szöveges instrukciókat közvetlenül a vizuális rétegeken hajtja végre.

- A nagy felbontású képek esetében képes a részletekre fókuszálni, miközben megtartja a globális rálátást.

- A modell belső súlyozása prioritást ad a környezeti tényezőknek, például a fényviszonyoknak vagy az árnyékoknak.

A digitális szórakoztatásban a grafikai megoldások elemzése kulcs a jó felhasználói élményhez. A Fiery Play kaszinó felületét vizsgálva az AI pontosan felismerte a kínálatot, játékokat ajánlott a személyes profilom alapján, és elmagyarázta a bónuszokat.

A videók elemzésének új dimenziója

Amikor egy videofájlt töltesz fel, a Gemini nem csupán képkockákat elemez, hanem értelmezi az időbeli eseménysorokat és az ok-okozati összefüggéseket is. Egy teszt során egy tízperces biztonsági kamerafelvételt mutattam neki, és megkértem, hogy keresse meg azt a pillanatot, amikor valaki elejtett egy kulcscsomót. A rendszer megjelölte az időkódot, sőt, még azt is leírta, hogy a tárgy a bal alsó sarokban lévő növény mögé pattant el a becsapódás után. Ez a mélységű elemzés radikálisan új kapukat nyit meg a tartalomgyártás és a biztonságtechnika területén egyaránt.

Kézírás és történelmi dokumentumok

A régi, nehezen olvasható kéziratok feldolgozása mindig is a történészek és levéltárosok számára okozott komoly fejtörést, de a Gemini itt is meglepő eredményeket produkál. Képes felismerni a kurzív írást, sőt, a tintafoltok vagy szakadások okozta hiányzó részeket is logikusan kiegészíti a környező szöveg alapján. Ez a funkció nemcsak a kutatást gyorsítja fel, hanem lehetővé teszi a kulturális örökség digitalizálását olyan hatékonysággal, amely korábban csak manuálisan volt lehetséges.

Teszteld te is a videós elemzést!

Sokan elfelejtik, hogy a képfelismerő képesség a hétköznapi problémamegoldásban is remek partner lehet, például egy elromlott háztartási gép megjavításakor vagy egy szobanövény betegségének azonosításakor. Elég egy rövid videót készítened a készülék belsejéről, miközben a motor furcsa hangot ad ki, és a Gemini képes beazonosítani a rezgő alkatrészt a vizuális minták alapján. Ez a fajta diagnosztikai segítség nem csupán időt takarít meg neked, hanem segít elkerülni a felesleges szervizköltségeket, amelyek gyakran több tízezer forintot is elérhetnek. A rendszer által adott pontos instrukciókkal te magad is elvégezheted az alapvető karbantartási feladatokat, csökkentve a háztartás ökológiai lábnyomát.

Modell verzió

Kontextus ablak

Képfeldolgozási sebesség

Logikai pontosság

Gemini 1.5 Flash

1 millió token

0.4 másodperc / kép

88%

Gemini 1.5 Pro

1 millió token

0.8 másodperc / kép

96%

Gemini 1.0 Ultra

32 ezer token

1.2 másodperc / kép

94%

Használd ki a Pro verzió adta lehetőségeket, ha komplex vizuális feladatok megoldása a célod a munkád során. A fejlesztők számára elérhető API-k segítségével ezek a funkciók beépíthetők saját alkalmazásokba is, ami forradalmasíthatja az e-kereskedelmet vagy az orvosi képalkotó rendszerek használatát. A vizuális bemenet és a szöveges instrukciók kombinálása olyan szinergiát hoz létre, amely korábban csak a sci-fi filmekben létezett.

Meglepő pontosság a geometria és logika területén

Egy bonyolult geometriai tankönyvi oldal fotóján a rendszer nemcsak megoldotta az egyenleteket, hanem lépésről lépésre levezette az ábrán látható összefüggéseket. A kopott jelölések és nem méretarányos rajz ellenére is felismerte a derékszögű háromszögek hasonlóságát, ami azt mutatja, hogy matematikai modelleket épít, nem pusztán mintákat másol.

A professzionális felhasználók számára a legizgalmasabb lehetőségek az alábbi pontokban foglalhatók össze:

- Kódgenerálás vizuális forrásból, például kézzel rajzolt weboldal vázlatok alapján azonnal.

- Bonyolult áramköri rajzok digitalizálása és szimulációs környezetbe való exportálása percek alatt.

- Statisztikai grafikonok adatainak kinyerése és azonnali szerkeszthető formátumba való konvertálása.

- Építészeti tervek elemzése a helyi szabályozásoknak való megfelelőség szempontjából automatizálva.

- Kémiai molekulaszerkezetek azonosítása és azok fizikai tulajdonságainak pontos előrejelzése.

Kezdj el már ma profitálni a Gemini újításaiból!

A tanulság egyértelmű: a vizuális tartalom már nem egy statikus adatpont az algoritmus számára, hanem egy dinamikus információforrás, amelyből logikai láncolatokat épít fel. A jövőben a látás és a gondolkodás közötti határvonal még tovább fog halványulni, és a gépek nemcsak segédeszközök, hanem valódi vizuális partnerek lesznek a mindennapi életben. Aki megtanulja hatékonyan kommunikálni a vizuális bemenetek és a szöveges kérések ötvözetét, az olyan versenyelőnyre tesz szert, amely a munkaerőpiac minden szegmensében felértékelődik majd.


Fékezőben a termőföldpiac - Mennyibe kerül most egy hektár föld?

A 2024. évi 2,236 millió forintról tavaly 2,264 millióra, mindössze 1,3%-kal nőtt az eladott termőföldek átlagos hektárára a NAV – egyelőre nem teljeskörű, szűrt – adatai alapján. A legjobban (21%) Zala megyében emelkedtek az árak, majd jócskán lemaradva Heves következik 14%-os drágulással. A lista másik végén Pest és Veszprém vannak 13-14% közötti csökkenéssel. (Az adatok értékelését némileg nehezíti a földhivataloknál tavaly bevezetett elektronikus ingatlannyilvántartási rendszerre való átállás okozta ügymenet-lassulás és adathiány, mely vélhetően Pest megyét érinti leginkább.)
2026. 06. 22. 14:00
Megosztás:

A magyar kkv-k használják, de még nem építették be a működésükbe a mesterséges intelligenciát

Jóllehet már tömegesen jelen van Magyarországon a mesterséges intelligencia, a rendszeres és tudatos használat még korántsem általános – derül ki az első AI Index Magyarország kutatásból. A Joint Venture Szövetség (JVSZ), a Code Intelligence és a Peak együttműködésében megvalósult felmérés mostantól rendszeresen ad majd visszajelzést a mesterséges intelligencia hazai használatáról, elfogadottságáról és gazdasági hatásairól.
2026. 06. 22. 13:30
Megosztás:

A Web3 jövője veszélyben? A tehetségek megvannak, az állások hiányoznak

A <a href="https://www.bitget.com/promotion/blockchain4youth?channelCode=regd&vipCode=6zld" target="_blank">Bitget Blockchain4Youth (B4Y)</a> kezdeményezése keretében elkészített Web3 Next-Gen Talent Intelligence Report jelentés szerint az iparág egyik legnagyobb munkaerőpiaci kihívása nem a tehetségek hiánya, hanem a felvételi akadályok jelenléte. A kutatás több régióból származó pályakezdő és karrierjük elején járó szakembereket kérdezett meg, és arra jutott, hogy bár a Web3 továbbra is magasan képzett tehetségeket vonz, sok jelentkező mégsem tudja megszerezni első állását a szektorban.
2026. 06. 22. 13:00
Megosztás:

Egyharmados forradalom a fizetésekben: a mobilokba tett kártyák átlépték az álomhatárt

Néhány év alatt huszonötszörösére növekedett a mobilokba digitalizált magyar bankkártyákkal végrehajtott vásárlások összege. Az elmúlt 12 hónap akkora emelkedést hozott, hogy a mobiltárcás vásárlások száma először haladta meg az összes kártyás vásárlás egyharmadát – derül ki a BiztosDöntés.hu elemzéséből. A lendület csökkenésének nyoma sincs, a mobilokba digitalizált kártyák száma már átlépte a 3 milliót.
2026. 06. 22. 12:30
Megosztás:

Andy Burnham fordulatot hozhat a brit kriptopolitikában

Andy Burnham látványos időközi választási győzelme nemcsak a brit Munkáspárt vezetését rendezheti át, hanem az Egyesült Királyság kriptovaluta-szabályozására is komoly hatással lehet. Manchester polgármestere nyíltan támogatja a Web3-szektort, miközben a jelenlegi kormány az elmúlt hónapokban szigorúbb irányt vett a digitális eszközökkel szemben.
2026. 06. 22. 12:00
Megosztás:

A reklámokra és a fogyasztói tájékoztatásokra vonatkozó szabályok betartását ellenőrzi az NKFH

A Nemzeti Kereskedelmi és Fogyasztóvédelmi Hatóság (NKFH) a kormányhivatalokkal együttműködve az idén is ellenőrzi, hogy a vállalkozások betartják-e a reklámokra és a fogyasztói tájékoztatásokra vonatkozó szabályokat. Az ellenőrzések célja a tisztességes piaci tájékoztatás és a tudatos fogyasztói döntések erősítése - közölte a hatóság az MTI-vel hétfőn.
2026. 06. 22. 11:30
Megosztás:

Kármán András: vezetőváltás az Államadósság Kezelő Központ élén

Június 22-től Tardos Gergely veszi át az Államadósság Kezelő Központ (ÁKK) Zrt. vezetését - jelentette be a pénzügyminiszter vasárnap a Facebook-oldalán.
2026. 06. 22. 11:00
Megosztás:

A Toss Bank és a Solana globális digitális pénzügyi központot épít

A dél-koreai Toss Bank stratégiai együttműködésre lépett a Solana Foundationnel, hogy blokkláncalapú infrastruktúrát fejlesszen a nemzetközi pénzátutalások és elszámolások kezelésére. A projekt első szakaszában a stabilcoinokkal végrehajtott határokon átnyúló tranzakciók gyorsaságát, költségeit és gyakorlati alkalmazhatóságát vizsgálják.
2026. 06. 22. 10:30
Megosztás:

Mire számíthatnak hétfőn a befektetők?

Az ázsiai részvénypiacok hétfőn emelkedtek, miután az iráni tárgyalók közölték, hogy előrelépés történt az Egyesült Államokkal folytatott béketárgyalásokon, ami enyhítette azokat a félelmeket, hogy a folyamat összeomlóban van. A japán Nikkei 1,9%-kal emelkedett, miután a múlt héten közel 8%-os növekedéssel történelmi csúcsra jutott. A dél-koreai piacon további 2,6%-os emelkedést mértek, miután a félvezető részvények iránti kereslet hatására a múlt héten több mint 11%-kal ugrott meg. A kínai SSEC szintén 0,2%-kal emelkedett.
2026. 06. 22. 10:00
Megosztás:

Emelkedtek pénteken a hozamok Európában, 352-es szint alatt fejezte be a hetet a forint

Az euróövezeti államkötvényhozamok pénteken emelkedtek, miután az Egyesült Államok és Irán közötti, Svájcban zajló béketárgyalásokat váratlanul megszakították, valamint az Európai Központi Bank döntéshozói határozottabb hangot ütöttek meg az inflációval kapcsolatban.
2026. 06. 22. 09:30
Megosztás:

Kis mértékben estek az európai részvények a pénteki bizonytalanság hatására, zárva voltak az amerikai tőzsdék

Az európai részvények enyhén csökkentek pénteken, mivel a befektetők óvatosak maradtak azt követően, hogy az Egyesült Államok és Irán közötti, a közel-keleti konfliktus lezárását célzó tárgyalások megtorpantak. Az európai átfogó részvényindex, a Stoxx 600 0,2%-kal alacsonyabban zárt, ugyanakkor így is 0,4%-os heti emelkedést ért el, miután a hét elején történelmi csúcsokra emelkedett.
2026. 06. 22. 09:00
Megosztás:

Egy 14 pontos megállapodás közel került a konfliktus lezárásához, a folytatódó harcok viszont megkérdőjelezték ennek tartósságát

A hét egészét ismét a közel-keleti konfliktussal kapcsolatos hírek dominálták, a piaci hangulat erősen javult a hét elején, amikor is úgy tűnt egy végleges 14 pontos megállapodás tartós tűzszünetet hozhat és végre újra megnyithat a Hormuzi-szoros.
2026. 06. 22. 08:30
Megosztás:

Folytatódik a kánikula a héten

A jövő héten folytatódik a kánikula: a hét elején általában 30 és 35 Celsius-fok között alakul a csúcshőmérséklet, míg a hét végén már jellemzően 33-38 fok várható a legmelegebb órákban. Hétfőn még lehet zápor, zivatar, esetleg felhőszakadás, majd csökken a csapadék esélye - derül ki a HungaroMet Zrt. előrejelzéséből, amelyet vasárnap juttattak el az MTI-hez.
2026. 06. 22. 08:00
Megosztás:

A miniszterelnök felszólalásával kezdődik a parlament ülése

A miniszterelnök napirend előtti felszólalásával kezdődik hétfőn az Országgyűlés kétnapos rendkívüli ülése. A plenáris ülésen ismét tárgyalják az európai uniós forrásokhoz történő hozzáférés érdekében szükséges törvénymódosításokat, a plakáttörvényt és a közmédia átalakításáról szóló előterjesztést.
2026. 06. 22. 07:35
Megosztás:

Erre figyeljünk, ha háziszörpöt készítünk! Élelmiszerbiztonsági tanácsok a Nébih-től

A nyári hónapok beköszöntével egyre többen készítenek különféle gyümölcsszörpöket és virágkivonat alapú szörpöket. A szezonális alapanyagok (málna, eper, bodzavirág) felhasználásával előállított szörpök népszerűsége évről évre növekszik, a biztonságos elkészítéshez azonban nem elegendő csupán egy jól bevált receptúra követése. A Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) Oktatási Programja a házi tartósítás során követendő jó gyakorlatokra hívja fel a figyelmet.
2026. 06. 22. 06:30
Megosztás:

Vitézy Dávid: hazahoznánk 700 milliárdot légkondicionált HÉV- és InterCity szerelvényekre

Egész hétvégén azon a törvényen dolgoztunk a kollégákkal, amivel még idén nyáron haza tudnánk hozni a 700 milliárd forintot új légkondicionált alacsonypadlós HÉV-ekre és InterCity motorvonatokra - közölte a közlekedési és beruházási miniszter vasárnap a közösségi oldalán, hozzátéve: ezzel együtt is sajnos sok év, mire egy új flottát leszállítanak.
2026. 06. 22. 05:30
Megosztás:

Újra terítéken az olajtúlkínálat: esik a nyersolaj ára az amerikai–iráni megállapodás után

Az olajpiac szereplői ismét egy korábban szinte teljesen leírt forgatókönyvvel számolnak: a túlkínálat visszatérésével. Az amerikai–iráni békemegállapodás hírére ugyanis jelentős esésbe kezdtek a nyersolajárak, ami újra életre keltette azokat az opciós fogadásokat, amelyek az olajpiac gyengülésére építenek.
2026. 06. 22. 04:30
Megosztás:

A lengyel-ukrán kapcsolatok rossz irányban haladnak

A lengyel-ukrán történelmi vita miatt rossz irányban haladnak a kétoldalú kapcsolatok, a helyzet eszkalálódása azonban Oroszországnak kedvez - írta Wladyslaw Kosiniak-Kamysz lengyel nemzetvédelmi miniszter vasárnap az X-en.
2026. 06. 22. 03:00
Megosztás:

Az özvegyi nyugdíjak törvényi változása lép életbe júliustól

Júliustól módosulnak az özvegyi nyugdíj szabályai: elsősorban a külön élő házastársakat és az élettársakat érintő előírások változnak meg.
2026. 06. 22. 02:30
Megosztás:

Ethereum: Most érdemes beszállni? Két esemény, ami felrázhatja az árfolyamot

Az Ethereum árfolyama közel 63%-kal esett vissza történelmi csúcsához képest, így sok befektető számára felmerül a kérdés: vajon most jó vétel lehet a világ második legnagyobb kriptovalutája?
2026. 06. 22. 02:00
Megosztás: