Gemini képfelismerés: ezeket tudja, amikre nem számítottam

A Google DeepMind kutatásai szerint a Gemini Ultra modell a vizuális benchmarkok 90%-ában felülmúlja az emberi átlagot, ami alapjaiban írja felül a gépi látásról alkotott eddigi elképzeléseinket. Ez a technológiai ugrás nem csupán a pixelek felismerését jelenti, hanem a kontextuális összefüggések olyan mély szintű értelmezését, amely korábban elképzelhetetlen volt.

Gemini képfelismerés: ezeket tudja, amikre nem számítottam

Hogyan olvassa a Gemini a vizuális káoszt?

Néhány hete egy kaotikus fejlesztői brainstorming után lefotóztam a nyilakkal, félig letörölt kóddal és kusza jegyzetekkel teli fehértáblát. Bár kételkedtem benne, feltöltöttem a Gemini 1.5 Pro-ba, amely másodpercek alatt strukturált dokumentummá rendezte és sorrendbe állította a projekt mérföldköveit.

Ez a folyamat rávilágított arra, hogy a modell képességei messze túlmutatnak az egyszerű alakzatfelismerésen, hiszen a rendszer a következőket hajtotta végre:

- Felismerte a kézzel írt, gyakran elmosódott technikai rövidítéseket és kontextusba helyezte azokat.

- Értelmezte a nyilak irányát, és ebből egy koherens folyamatábrát vázolt fel a szoftveres architektúráról.

- Kiszűrte a táblán maradt irreleváns firkákat, amelyeket a korábbi megbeszélések során hagytunk ott.

- Logikai kapcsolatot teremtett a különböző színekkel írt megjegyzések és a fő folyamatok között.

- Javaslatot tett a vázlatban szereplő hiányzó lépésekre, kiegészítve a fejlesztési terv logikai réseit.

Döbbenetes volt látni, ahogy a neurális hálózat felismeri a kézírásos jegyzeteket és kontextusba helyezi azokat a korábbi szoftverarchitektúráról szóló beszélgetéseinkkel. Ez a szintű vizuális logika messze túlmutat a hagyományos optikai karakterfelismerés keretein, hiszen itt a szemantikai értelmezés dominált a puszta alakzatfelismerés felett. A rendszer nem csupán látott, hanem értett is, ami alapjaiban változtatja meg a napi munkafolyamatokat és az adatrögzítés módszertanát a modern irodai környezetben.

A natív multimodalitás technológiai háttere

A korábbi MI-modellek gyakran külön modulokból álltak, például egy látórendszerből és egy nyelvi modellből. A Google Gemini ezzel szemben natívan multimodális: betanításkor egyszerre dolgoz fel szöveget, képet, videót és hangot, és nem alakítja a képet szöveggé, hanem vizuális tokenekkel dolgozik. Transzformátor-alapja kiterjesztett figyelemmechanizmussal keresztreferenciákat hoz létre a vizuális elemek és a tudás között.

A technológia kifinomultságát jól jelzi, hogy a rendszer milyen módon kezeli a komplexitást:

- A pixeladatokat azonnal matematikai vektorokká alakítja, amelyek hordozzák a tárgyak tulajdonságait.

- Képes párhuzamosan elemezni több ezer képkockát egyetlen videofájlban a kontextus elvesztése nélkül.

- A kereszt-modális tanulás révén a szöveges instrukciókat közvetlenül a vizuális rétegeken hajtja végre.

- A nagy felbontású képek esetében képes a részletekre fókuszálni, miközben megtartja a globális rálátást.

- A modell belső súlyozása prioritást ad a környezeti tényezőknek, például a fényviszonyoknak vagy az árnyékoknak.

A digitális szórakoztatásban a grafikai megoldások elemzése kulcs a jó felhasználói élményhez. A Fiery Play kaszinó felületét vizsgálva az AI pontosan felismerte a kínálatot, játékokat ajánlott a személyes profilom alapján, és elmagyarázta a bónuszokat.

A videók elemzésének új dimenziója

Amikor egy videofájlt töltesz fel, a Gemini nem csupán képkockákat elemez, hanem értelmezi az időbeli eseménysorokat és az ok-okozati összefüggéseket is. Egy teszt során egy tízperces biztonsági kamerafelvételt mutattam neki, és megkértem, hogy keresse meg azt a pillanatot, amikor valaki elejtett egy kulcscsomót. A rendszer megjelölte az időkódot, sőt, még azt is leírta, hogy a tárgy a bal alsó sarokban lévő növény mögé pattant el a becsapódás után. Ez a mélységű elemzés radikálisan új kapukat nyit meg a tartalomgyártás és a biztonságtechnika területén egyaránt.

Kézírás és történelmi dokumentumok

A régi, nehezen olvasható kéziratok feldolgozása mindig is a történészek és levéltárosok számára okozott komoly fejtörést, de a Gemini itt is meglepő eredményeket produkál. Képes felismerni a kurzív írást, sőt, a tintafoltok vagy szakadások okozta hiányzó részeket is logikusan kiegészíti a környező szöveg alapján. Ez a funkció nemcsak a kutatást gyorsítja fel, hanem lehetővé teszi a kulturális örökség digitalizálását olyan hatékonysággal, amely korábban csak manuálisan volt lehetséges.

Teszteld te is a videós elemzést!

Sokan elfelejtik, hogy a képfelismerő képesség a hétköznapi problémamegoldásban is remek partner lehet, például egy elromlott háztartási gép megjavításakor vagy egy szobanövény betegségének azonosításakor. Elég egy rövid videót készítened a készülék belsejéről, miközben a motor furcsa hangot ad ki, és a Gemini képes beazonosítani a rezgő alkatrészt a vizuális minták alapján. Ez a fajta diagnosztikai segítség nem csupán időt takarít meg neked, hanem segít elkerülni a felesleges szervizköltségeket, amelyek gyakran több tízezer forintot is elérhetnek. A rendszer által adott pontos instrukciókkal te magad is elvégezheted az alapvető karbantartási feladatokat, csökkentve a háztartás ökológiai lábnyomát.

Modell verzió

Kontextus ablak

Képfeldolgozási sebesség

Logikai pontosság

Gemini 1.5 Flash

1 millió token

0.4 másodperc / kép

88%

Gemini 1.5 Pro

1 millió token

0.8 másodperc / kép

96%

Gemini 1.0 Ultra

32 ezer token

1.2 másodperc / kép

94%

Használd ki a Pro verzió adta lehetőségeket, ha komplex vizuális feladatok megoldása a célod a munkád során. A fejlesztők számára elérhető API-k segítségével ezek a funkciók beépíthetők saját alkalmazásokba is, ami forradalmasíthatja az e-kereskedelmet vagy az orvosi képalkotó rendszerek használatát. A vizuális bemenet és a szöveges instrukciók kombinálása olyan szinergiát hoz létre, amely korábban csak a sci-fi filmekben létezett.

Meglepő pontosság a geometria és logika területén

Egy bonyolult geometriai tankönyvi oldal fotóján a rendszer nemcsak megoldotta az egyenleteket, hanem lépésről lépésre levezette az ábrán látható összefüggéseket. A kopott jelölések és nem méretarányos rajz ellenére is felismerte a derékszögű háromszögek hasonlóságát, ami azt mutatja, hogy matematikai modelleket épít, nem pusztán mintákat másol.

A professzionális felhasználók számára a legizgalmasabb lehetőségek az alábbi pontokban foglalhatók össze:

- Kódgenerálás vizuális forrásból, például kézzel rajzolt weboldal vázlatok alapján azonnal.

- Bonyolult áramköri rajzok digitalizálása és szimulációs környezetbe való exportálása percek alatt.

- Statisztikai grafikonok adatainak kinyerése és azonnali szerkeszthető formátumba való konvertálása.

- Építészeti tervek elemzése a helyi szabályozásoknak való megfelelőség szempontjából automatizálva.

- Kémiai molekulaszerkezetek azonosítása és azok fizikai tulajdonságainak pontos előrejelzése.

Kezdj el már ma profitálni a Gemini újításaiból!

A tanulság egyértelmű: a vizuális tartalom már nem egy statikus adatpont az algoritmus számára, hanem egy dinamikus információforrás, amelyből logikai láncolatokat épít fel. A jövőben a látás és a gondolkodás közötti határvonal még tovább fog halványulni, és a gépek nemcsak segédeszközök, hanem valódi vizuális partnerek lesznek a mindennapi életben. Aki megtanulja hatékonyan kommunikálni a vizuális bemenetek és a szöveges kérések ötvözetét, az olyan versenyelőnyre tesz szert, amely a munkaerőpiac minden szegmensében felértékelődik majd.


Mire számíthatnak kedden a befektetők?

Ma reggelre jelentős eladási hullám bontakozott ki az ázsiai piacokon is. A Nikkei és a dél-koreai Kospi is 1,5%-ot meghaladó mínuszban tartózkodik.
2026. 06. 02. 10:30
Megosztás:

Az inflációs félelmek erősödése miatt ismét emelkedtek a hozamok és gyengült a forint

Az olajárak emelkedése ismét növelte az inflációs félelmeket, így a múlt heti esés után a kötvénypiacokon ismét emelkedtek a hozamok, tegnap a tízéves amerikai hozam 3 bázisponttal nőtt, közelítve a 4,5%-ot. Európában ennél is nagyobb mértékben, 5-10 bázisponttal kerültek feljebb a hosszú hozamok, a német tízéves ismét közelíti a 3%-ot. A dollár erősödött az euróval szemben, 0,3%-kal, 1,1625 körül jár az EURUSD.
2026. 06. 02. 10:00
Megosztás:

Továbbra is az AI és software cégek hátán emelkednek az amerikai részvénypiacok

Mérsékelt emelkedéssel zártak hétfőn az amerikai részvénypiacok, a technológiai szektor felülteljesítése mellett. A Nasdaq (+0,42%) és az S&P 500 (+0,26%) új történelmi csúcsra emelkedett, míg a Dow Jones (+0,09%) csak visszafogott mértékben tudott emelkedni. Az S&P 500 szektorai közül mindössze a technológia és az energia zárt emelkedéssel, míg a legnagyobb vesztes a közműszektor lett.
2026. 06. 02. 09:30
Megosztás:

Eséssel zárt Európa a Közel-Keletről érkező negatív hírek miatt

Az európai részvénypiacok hétfőn estek, miután a közel-keleti feszültségek eszkalálódása jelentősen csökkentette a rövid távú rendezés esélyét az Irán körüli konfliktusban. A befektetők emellett a brit EasyJet körül kibontakozó felvásárlási fejleményeket is értékelték.
2026. 06. 02. 09:00
Megosztás:

Ennyit erősödött a forint kedd reggelre

Erősödött a forint árfolyama kedd reggel a főbb devizákkal szemben a hétfő esti jegyzéséhez képest a nemzetközi devizakereskedelemben.
2026. 06. 02. 08:30
Megosztás:

Tévedett a Bankless alapítója? Az on-chain adatok szerint az Ethereum továbbra is komoly nyomás alatt áll

Komoly visszhangot váltott ki a kriptoközösségben, amikor David Hoffman, a Bankless társalapítója bejelentette, hogy eladta Ethereum-állományát. A szakember szerint az úgynevezett „ETH mint pénz” narratíva kifulladt, és az Ethereum natív tokenje előtt már nem áll olyan növekedési potenciál, amely indokolná a hosszú távú tartást. A blokklánc-hálózat működését vizsgáló on-chain mutatók egyelőre nem cáfolják ezt az álláspontot, sőt több adat is arra utal, hogy a piac jelenleg inkább a pesszimista forgatókönyvet árazza.
2026. 06. 02. 08:00
Megosztás:

Szenved a szőlő: már most látszik, hogyan írja át a klímaváltozás a magyar bor jövőjét

Klár Máté videóriportja magyar borászok és kutatók megszólalásain keresztül mutatja meg, hogyan gyorsul fel a szőlő érési ciklusa, hogyan csökken a víz mennyisége, és miért válhatnak extrémmé a hazai nyarak. A Duna–Tisza közén dolgozó termelők személyes tapasztalatai és kutatók tudományos magyarázatai együtt teszik világossá a képet: a változás már nem jövőidő. Videó a cikkben!
2026. 06. 02. 07:30
Megosztás:

Az EU sürgeti Boszniát: reformok nélkül százmilliók veszhetnek el

Bosznia-Hercegovina már csak néhány reformlépésre van attól, hogy továbbléphessen az európai uniós csatlakozási folyamat következő szakaszába, ugyanakkor több százmillió eurónyi uniós támogatást kockáztat, ha nem gyorsítja fel a szükséges intézkedések végrehajtását - jelentette ki António Costa, az Európai Tanács elnöke hétfőn Szarajevóban.
2026. 06. 02. 06:30
Megosztás:

Túllépett májusban a lakáspiaci kereslet és kínálat az idei mélyponton

Vége a korábbi toporgásnak, elmozdult májusban a mélypontról a lakáspiac az ingatlan.com legfrissebb kereslet-kínálati összesítője szerint. Bár összességében a lakáspiac mindkét oldala enyhén élénkült, az is látható, hogy az országon belül jelentős különbségek vannak, valamint az új és a használt lakások is teljesen eltérő pályán mozognak.
2026. 06. 02. 06:00
Megosztás:

Orbán Anita elsőként a holland külügyminisztert fogadta

Orbán Anita külügyminiszter a választás után elsőként holland partnerét, Tom Berendsent fogadta hivatalos látogatáson a Külügyminisztériumban hétfőn.
2026. 06. 02. 05:30
Megosztás:

Kiemelkedő árbevétel- és piacirészesedés-növekedés a Praktikernél 2025-ben

Jelentős árbevétel-növekedéssel, eredményjavulással, továbbá növekvő piaci részesedéssel zárta a 2025-ös évet a Praktiker. A magyar tulajdonú barkácslánc nettó árbevétele közel 12 százalékkal 100 milliárd forint közelébe emelkedett, eredményessége a stagnáló piaci környezet és az intenzív beruházások rövidtávú költséghatásai ellenére is javult. A vállalat barkácspiaci részesedése 33,7 százalékra erősödött, miközben tavaly két új áruházat nyitott, fejlesztette digitális vásárlási megoldásait és áruházi szolgáltatásait is.
2026. 06. 02. 05:00
Megosztás:

Ritka beszállási lehetőség előtt állhat a Bitcoin? Egy veterán elemző szerint közeledik a fordulat

Miközben az intézményi befektetők egymás után vonják ki tőkéjüket a Bitcoinhoz kapcsolódó tőzsdén kereskedett alapokból (ETF-ekből), egy ismert piaci elemző szerint éppen ez a jelenség utalhat arra, hogy a piac egy fontos fordulóponthoz közeledik.
2026. 06. 02. 04:30
Megosztás:

Nem Budapesten a legdrágábbak a lakások Magyarországon. De akkor mégis hol?

A Zenga Ingatlan Radar adataiból kiderül, hogy milyen négyzetméteráron hirdetik az ingatlanokat az egyes vármegyékben. A négyzetméterárak tekintetében messze a főváros vezet. De akkor mi az a mutató, ami alapján a Bankmonitor szakértői azt gondolják van olyan vármegye, ahol drágábban lehet lakást vásárolni, mint Budapesten.
2026. 06. 02. 04:00
Megosztás:

Gazdasági totálkár vagy még menthető befektetés? Ennyit költenek a magyarok a régi autóikra

Egy autó értékének harmadába kerülő javítás sokaknál már megkongatná a vészharangot. A magyar autósok többségénél viszont nem…
2026. 06. 02. 03:30
Megosztás:

Donald Trump: Izrael és a Hezbollah a harci cselekmények leállítására tett ígéretet

Izrael és a Hezbollah a harci cselekmények leállítására tett ígéretet - közölte Donald Trump a két féllel folytatott telefonbeszélgetésére hivatkozva hétfőn.
2026. 06. 02. 03:00
Megosztás:

Hol élnek a legjobban kereső magyarok? Sokan meg fognak lepődni…

Budapest? Sopron? Győr? Nem biztos, hogy ott kell keresni a legmagasabb fizetésből élő honfitársainkat, ahol elsőre gondolnánk! A kereseti adatok mától településszinten is elérhetők a Központi Statisztikai Hivatal (KSH) térképes interaktív felületén (TIMEA).
2026. 06. 02. 02:30
Megosztás:

1185,5 milliárd forintra nőtt a SPAR forgalma 2025-ben

A SPAR Magyarország márkaforgalma 2025-ben 1185,5 milliárd forintot ért el, ami 5,9 százalékos növekedést jelentett a megelőző évhez képest. A vállalat a kihívásokkal teli piaci környezet ellenére is folytatta fejlesztési programját: 27,7 milliárd forintot fordított meglévő áruházai korszerűsítésére és új üzletek létesítésére. Miközben három új egységet nyitott és húsz áruházat modernizált, tovább bővítette franchise-hálózatát, valamint jelentős logisztikai és élelmiszer-termelési beruházásokat hajtott végre.
2026. 06. 02. 02:00
Megosztás:

Vigyázat! Az özvegyi nyugdíj 3 esetben is megszűnhet

Sokan azt gondolják, hogy ha egyszer megállapították az özvegyi nyugdíjat, akkor az automatikusan, változatlanul jár tovább. A valóság ennél jóval árnyaltabb: a nyugdíjtörvény pontosan meghatározza, milyen esetekben szűnhet meg az özvegyi nyugdíjra való jogosultság.
2026. 06. 02. 01:30
Megosztás:

Mi történt májusban a magyar tőzsdén?

Kiegyensúlyozott kereskedési aktivitás mellett zárta a májust a Budapesti Értéktőzsde, a BUX index 134 616,81 ponton állt a hónap végén. Az azonnali részvénypiaci forgalom összesen 511,6 milliárd forintot tett ki, ami napi átlagban 26,9 milliárd forintos kereskedési volument jelentett. A befektetői aktivitás továbbra is az OTP Bank, a MOL és a Magyar Telekom részvényeire koncentrálódott, amelyekkel 306,9, 64,4 és 57,9 milliárd forintos forgalom zajlott a tőzsdén. A brókercégek közül májusban is a WOOD & Company zárt az első helyen a kereskedési volumeneket tekintve, a dobogó második és harmadik helyein a Concorde és az ERSTE zárt.
2026. 06. 02. 01:00
Megosztás:

Kétezermilliárdos növekedési tartalék hever parlagon a magyar munkaerőpiacon

A 45 év feletti, 20-30 éves tapasztalattal rendelkező vezetők és szakemberek munkaerőpiaci kiszorítása nem csupán HR-kihívás vagy egyéni probléma, hanem súlyos makrogazdasági és vállalati veszteség. A The Seniors számításai alapján a kordiszkrimináció Magyarországon évente 1400-2200 milliárd forintos GDP-kiesést okoz, ami a teljes nemzeti össztermék 1,6-2,5 százalékának felel meg. Csillag-Csatlós Csilla executive coach szerint a túl drága a senior munkaerő érvelés egy olyan számviteli illúzió eredménye, amely a negyedéves pénzügyi jelentésekben ugyan megtakarításnak látszik, de 12-18 hónapos időhorizonton drasztikus EBITDA-csökkenést és súlyos hatékonyságveszteséget okoz a vállalatoknak.
2026. 06. 02. 00:30
Megosztás: