Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Izrael megtámadta Iránt

Izrael megelőző csapást mért Iránra - jelentette be szombat reggel Jiszrael Kac izraeli védelmi miniszter. Az IRNA iráni állami hírügynökség mindeközben robbanásokat jelentett Teheránból.
2026. 02. 28. 09:00
Megosztás:

Az Erste Ingatlan Alapok nyerték el az „Év Ingatlanpiaci Vállalata” díjat a Real Estate Awardson

A hazai ingatlanpiac egyik legjelentősebb szakmai díjával ismerték el az Erste Ingatlan Alapok több mint két évtizedes, stabil és értékteremtő működését a 2026-os Real Estate Awards gálán. Az elismerés a társaság piacvezető szerepét, fenntarthatósági törekvéseit és következetes üzleti teljesítményét igazolja.
2026. 02. 28. 08:00
Megosztás:

Átadták az Év szállodája 2025 elismeréseket

Átadták az Év szállodája 2025 elismeréseket pénteken este, a pályázatot tavaly szeptemberben hirdette meg a Magyar Szállodák és Éttermek Szövetsége (MSZÉSZ) a Visit Hungary szakmai partnerségében - közölte a MSZÉSZ az MTI-vel.
2026. 02. 28. 06:00
Megosztás:

Így teremthetnek versenyelőnyt a bizonytalanságból a biztosítók

A makrogazdasági bizonytalanság, a geopolitikai feszültségek, a szabályozási környezet széttagoltsága, illetve a gyors technológiai változások egyre összetettebb és kiszámíthatatlanabb működési körülményeket teremtenek világszerte a biztosítási szektor számára – állapítja meg az EY legfrissebb ágazati jelentése. Ezek a megatrendek a kihívások mellett azonban lehetőségeket is kínálnak az intézetek vezetőinek.
2026. 02. 28. 05:00
Megosztás:

Nőtt a lakáskárok száma, a szélsőséges időjárási hatásokra is fel kell készülni

A lakáskárok száma 36 százalékkal emelkedett 2025-ben, miközben a szélsőséges időjárás egyre nagyobb szerepet játszik az ingatlanokat érintő káreseményekben – derült ki az MBH Bank reprezentatív kutatásából[1] és a CIG Pannónia Első Magyar Általános Biztosító Zrt. lakásbiztosítási állományára vonatkozó éves adataiból. A közös elemzés szerint miközben nő a kárkifizetések összege, a háztartások egy része kevésbé készül fel pénzügyileg a váratlan helyzetekre, és továbbra is jelentős az alulbiztosítottság kockázata. A növekvő kockázatok miatt kiemelten fontos a megfelelő lakásbiztosítás kiválasztása, amelyben már mesterséges intelligencián alapuló szakértői támogatás is segíti az ügyfeleket.
2026. 02. 28. 04:00
Megosztás:

Megjelent a NAV 2026-os ellenőrzési terve - lássuk kik vannak a célkeresztben

Megjelent a Nemzeti Adó- és Vámhivatal (NAV) 2026-os ellenőrzési terve. A dokumentum alapján az elmúlt évek hagyományait folytatva az adatvagyonát felhasználva idén is célzottan választja ki ellenőrzésre az adózókat a hatóság. A Deloitte szakértői szerint a NAV-ot továbbra is a fokozatosság elve vezérli: először adatot egyeztet, illetve támogat, azonban a visszaesőknél azonnal közbeavatkozik.
2026. 02. 28. 03:00
Megosztás:

Koleszterin, vérnyomás: rendben! De mi a helyzet a vérzsírral?

A vezetők jelentős része rendszeresen ellenőrizteti a koleszterinszintjeit és a vérnyomását. Ha ezek rendben vannak, megnyugodnak. A számok jók, a teljesítmény magas, a napi működés stabil. A kockázat „kezelve”. A legutóbbi kutatási eredmények alapján a szív-érrendszeri kockázat ugyanakkor nem kizárólag a koleszterinszintről szól.
2026. 02. 28. 02:00
Megosztás:

Döntött az Unió! Mindenki fizetését nyilvánosságra kell hozni, amit sokan nem akarnának...

Az idő szorít: hamarosan alkalmazni kell az Európai Unió bérátláthatósági irányelvét, miközben jelenleg a vállalatok 75%-a és a munkavállalók 51%-a sem támogatná, hogy a keresetek mindenki számára hozzáférhetővé váljanak.
2026. 02. 28. 01:00
Megosztás:

Zöld jelzést kapott a Richter tocilizumab bioszimiláris készítménye az EMA-tól

Pozitív szakvéleményt adott ki a Tuyory európai forgalomba hozatali engedélyének megadására az Európai Gyógyszerügynökség (EMA) emberi felhasználásra szánt gyógyszerkészítmények bizottsága (CHMP), a készítményt a Richter és a Mochida Pharmaceutical Co. Ltd. közösen fejlesztette ki a RoActemr tocilizumab bioszimiláris változataként - közölte a Richter pénteken a Budapesti Értéktőzsde (BÉT) honlapján.
2026. 02. 27. 23:00
Megosztás:

Áttört egy lélektani határt a kisgyermekes nők munkavállalási kedve

A Központi Statisztikai Hivatal (KSH) legfrissebb adatai alapján 2025-ben is stabilan magas szinten maradt a 25–49 éves korú nők foglalkoztatási rátája. A 85% körüli mutató jelzi, hogy a rugalmas foglalkoztatási formák terjedésével egyre több kisgyermekes anyukát sikerül sikeresen integrálni a munkaerőpiacra.
2026. 02. 27. 22:00
Megosztás:

Kriptotélben a Bitcoin: HODL, újrasúlyozás és adóoptimalizálás a túléléshez

A kriptopiaci tél nem az első – és valószínűleg nem is az utolsó – komoly próbatétel a befektetők számára. Amikor az árfolyamok tartósan esnek, a likviditás szűkül, a tőkeáttételes (leveraged) pozíciók leépülnek és a hangulat védekezővé válik, a piac valójában nemcsak az árakat, hanem a befektetői meggyőződést is teszteli. Ilyenkor a legellenállóbb szereplők nem pánikszerűen reagálnak, hanem újraértékelik és megerősítik az eredeti befektetési tézisüket – különösen a Bitcoin esetében.
2026. 02. 27. 21:30
Megosztás:

Gyengült pénteken a forint

Gyengült pénteken a forint a főbb devizákkal szemben a kora reggeli jegyzéséhez képest, de a hetet és február hónapot erősödéssel fejezte be.
2026. 02. 27. 21:00
Megosztás:

Szijjártó Péter: Jönnek az ultramodern kínai motorvonatok

Elindult a teherforgalom a Budapest-Belgrád vasútvonalon, így Magyarország megkerülhetetlen lett a Dél- és Nyugat-Európa közötti áruszállításban és közlekedésben - közölte Szijjártó Péter külgazdasági és külügyminiszter pénteken Belgrádban.
2026. 02. 27. 20:00
Megosztás:

A Shopper Park Plus Nyrt. ismét BÉT Legek díjat nyert

A Shopper Park Plus Nyrt. (SPP) újabb rangos tőzsdei díjat nyert, immár harmadik egymást követő évben részesülve szakmai elismerésben különböző kategóriákban. A BÉT Legek Az év legnagyobb nyilvános új részvénykibocsátása díj visszaigazolja a Társaság következetes növekedési stratégiáját, transzparens működését és befektetőközpontú szemléletét.
2026. 02. 27. 19:30
Megosztás:

Franciaországban egy kibertámadás során 15 millió páciens adatait lophatták el

Egy 1500 francia orvost célzó kibertámadás 2025 végén betegadatok kiszivárgásához vezetett - jelentette be pénteken a megtámadott szoftvert gyártó cég, az egészségügyi minisztérium pedig 15 millióra becsülte az érintett páciensek számát.
2026. 02. 27. 18:30
Megosztás:

Folytatódik a lakossági lomtalanítás a fővárosban

Budapesten az V. és a XIII. kerületben folytatódik a februárban megkezdett lakossági lomtalanítás - tudatta a MOHU Budapest kommunikációjával foglalkozó ügynökség pénteken az MTI-vel.
2026. 02. 27. 18:00
Megosztás:

Elfogyott a Bitcoin gamma-hatás – de a likviditás még mindig gátat szab az emelkedésnek

A Bitcoin árfolyama látszólag mozdulatlan, de a derivatív piac mélyén komoly átrendeződés zajlik. Miközben a BTC 66 000 dollár körül oldalaz, több milliárd dollárnyi gamma-kitettség (gamma exposure) futott ki az opciós piacon. A mechanikus árfolyam-erősítő hatás eltűnőben van – a kérdés most az, hogy visszatér-e a likviditás, vagy továbbra is törékeny marad a piac.
2026. 02. 27. 17:30
Megosztás:

4iG megállapodás a Mubadalával

A 4iG Csoport és a Mubadala Investment Company PJSC (Mubadala), a világ egyik vezető szuverén befektetési társasága megállapodást írtak alá, amelynek keretében a Mubadala 50 millió USD összegű befektetést valósít meg a magyar vállalatcsoportban, a lejáratkor kötelezően 4iG részvénnyé alakuló kölcsönszerződés keretében.
2026. 02. 27. 16:30
Megosztás:

Az amerikai közlekedési hivatal Hedera-alapú útdíjrendszert szabadalmaztatott

Egy amerikai kormányzati tisztviselő országos közúti díjszedési rendszert szabadalmaztatott a Hedera technológiájára építve – a lépés új lendületet adott a HBAR ökoszisztémának és a hosszú távú intézményi adoptáció narratívájának. A fejlemény nem pusztán spekulatív kriptós hír, hanem egy kézzelfogható, állami szintű kezdeményezés, amely a decentralizált főkönyvi technológiák (DLT – Distributed Ledger Technology) infrastruktúra-szerepét vetíti előre.
2026. 02. 27. 16:00
Megosztás:

Nőtt a Richter bevétele, csökkent a profit tavaly

A Richter Gedeon Nyrt. konszolidált árbevétele tavaly 928,96 milliárd forint lett, 8,3 százalékkal magasabb az egy évvel korábbinál - közölte a gyógyszeripari vállalat a Budapesti Értéktőzsde (BÉT) honlapján pénteken.
2026. 02. 27. 15:30
Megosztás: