Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Feszültség a Közel-Keleten - Szárnyal az arany, drágul az olaj a konfliktus miatt

A piacokon az új hét az Egyesült Államok és Izrael Irán elleni összehangolt támadásai, valamint Teherán kiterjedt rakétás megtorlása közepette indul. A támadások iráni és izraeli célpontokat, a szövetséges országokban található amerikai támaszpontokat, továbbá az Egyesült Arab Emírségekben, Katarban, Bahreinben, Kuvaitban és Libanonban lévő helyszíneket vettek célba, sőt az incidensek többek között Ciprusig, Jordániáig és Pakisztánig is elértek. A piaci helyzetet a Magyarországon is jelen lévő globális befektetési alkalmazás, az XTB szakértői elemezték.
2026. 03. 03. 03:00
Megosztás:

Magyarország a régió élmezőnyében az elsődleges egyenleg alapján

A legfrissebb adatok és előrejelzések alapján Magyarország költségvetési pozíciója régiós összevetésben továbbra is az egyik legkedvezőbb. Az eredményszemléletű hiány tavaly a kormányzati várakozások szerint 5% alatt alakulhatott, melyet megerősít a Magyar Nemzeti Bank friss, 4,7%-os hiányról szóló közlése is. Részben a költségvetés jó állapota, részben a megkezdett jegybanki lazítás lehet a magyarázata annak, hogy az utóbbi időben a nemzetközi befektetők nagyon készségesen finanszírozzák az államot.
2026. 03. 03. 02:30
Megosztás:

Ma nemcsak telihold, hanem vérhold is lesz! Mit hoz ez a horoszkópjegyednek?

Van az az este, amikor az égbolt nem egyszerűen „szép”, hanem üzen. A telihold eleve ilyen: felerősíti a hangulatokat, ráirányítja a figyelmet arra, amit nappal elintézünk egy vállrándítással, és mintha kicsit hangosabbra tekerné a belső monológunkat is. Március 3-án telihold van, ráadásul ez a telihold most nem akármilyen: vérhold, vagyis teljes holdfogyatkozás társul hozzá.
2026. 03. 03. 02:00
Megosztás:

Rövidesen csatlakozik az EU-hoz egy nagyon gazdag ország - minden megváltozik ezzel

Hamarosan az Európai Unió tagja lehet a világ egyik legtehetősebb állama: felgyorsulhat a folyamat.
2026. 03. 03. 01:00
Megosztás:

Az építőipar számára 2026-ban a lakásépítés és felújítás lehet a kitörési pont

A rendelésállományt és a cégek véleményét figyelembe véve 2026-ban a termelés enyhe csökkenésére készül az építőipar, az ágazat számára a lakásépítés és felújítás lehet a kitörési pont - állapítja meg elemzésében az Építési Vállalkozók Országos Szakszövetsége (ÉVOSZ). A szövetség szerint a lakásfelújítást az Otthonfelújítási Program és a vidéki otthontámogatási program erősíti, az Otthon Start programban pedig az idén mintegy 25 000 új lakás lehet kivitelezés alatt, ami 800 milliárd forint többlet megrendelést jelenthet.
2026. 03. 03. 00:30
Megosztás:

Sonkától a tojásfestékig, átfogó Nébih ellenőrzés zajlik egészen húsvétig

Március 2-án indul az idei tavaszi szezonális élelmiszerlánc-ellenőrzés, melyet Tállai András az Agrárminisztérium (AM) parlamenti államtitkára rendelt el. A vármegyei kormány- és a járási hivatalok szakemberei a Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) irányításával egészen április 6-ig végzik majd a húsvéti ünnepkörhöz kapcsolódó vizsgálatokat - közölte az Agrárminisztérium (AM) az MTI-vel hétfőn.
2026. 03. 03. 00:05
Megosztás:

200 ezer fát ültettek el a Nemzeti Faültetés Napján

A Nemzeti Faültetés Napja – 2026 ültetési ünnep keretében közel 200 000 fát ültettek el 200 helyszínen országszerte, 150 csatlakozó szervezet részvételével, 40 000 ingyenesen igényelhető facsemetével 10 000 résztvevő közreműködésével. Ezzel megduplázták a tavalyi rekordév ültetés számát. A 10 millió Fa Alapítvány a Nemzeti Faültetés Napján bemutatta a Népligeti Kiáltvány 10 pontját is, az alapítvány szakpolitikai és közpolitikai javaslatcsomagját.
2026. 03. 02. 23:30
Megosztás:

Mintegy ezer szlovén rekedt külföldön a közel-keleti feszültség miatt

A közel-keleti helyzet eszkalálódása és a járattörlések miatt mintegy ezer szlovén állampolgár rekedt külföldön, főként Dubajban, valamint Ázsiában és Óceániában - közölte hétfőn a Szlovén Utazási Irodák Szövetsége.
2026. 03. 02. 23:00
Megosztás:

Új vezérigazgató irányítja a Graboplast növekedését

Az építőanyag-ipar területén komoly vezetői tapasztalatokkal rendelkező új vezérigazgató került a győri székhelyű Graboplast élére: a Közép-Európában meghatározó padlógyártót 2026 márciusától Járomi Judit irányítja. A szakember közel 30 éve dolgozik vezető beosztásban különböző gyártói és kereskedelmi területeken, az utóbbi években az exportpiacokra fókuszáló nemzetközi építőanyag-gyártó vállalatoknál.
2026. 03. 02. 22:30
Megosztás:

Mesterséges Intelligencia Zászlóshajó Programot indított az ELTE

Mesterséges Intelligencia Zászlóshajó Programot indított az Eötvös Loránd Tudományegyetem (ELTE).
2026. 03. 02. 22:00
Megosztás:

A Shell a hétfői nap egyik nyertese a londoni tőzsdén

A holland-brit Shell olajpari konszern a hétfői kereskedési nap egyik nyertese a londoni tőzsdén.
2026. 03. 02. 21:30
Megosztás:

Vitalik Buterin: A Poseidon hash kulcsszerepe az Ethereum jövőjében

Az Ethereum skálázhatósági vitája új szintre lépett: Vitalik Buterin szerint komoly teljesítményvesztést okozhat, ha a hálózat a tervezett state tree frissítések során elhagyja a Poseidon hash függvényt. A tét nem kisebb, mint a bizonyítási hatékonyság (prover efficiency), a zero-knowledge (ZK) integráció és az Ethereum hosszú távú technológiai ütemterve.
2026. 03. 02. 21:00
Megosztás:

Gyengült a forint hétfő estére

Gyengült a forint a főbb devizákkal szemben hétfőn kora estére a bankközi devizapiacon reggelhez képest.
2026. 03. 02. 20:30
Megosztás:

Rekordösszegű támogatás geotermikus beruházásokra

Március elejétől az első kútfúrásokra fordítható vissza nem térítendő támogatás és egy kamatmentes hitelprogram is ösztönzi a geotermikus beruházásokat összesen 29 milliárd forinttal - jelentette be hétfői közleményében az Energiaügyi Minisztérium (EM).
2026. 03. 02. 20:00
Megosztás:

Duna House: Bővülő lakáseladás és erős hitelezés jellemezte a februárt

A DH Group havi tranzakciószám-becslése (DH-TB) és jelzáloghitel-előrejelzése alapján 2026 februárjában országosan 8 769 lakóingatlan cserélt gazdát, a lakáscélú jelzáloghitelek szerződéses összege pedig elérhette a 250 milliárd forintot.
2026. 03. 02. 19:30
Megosztás:

Stratégiai jelentőségű nemzetközi megállapodásokat kötött a 4iG

4iG hosszú távra szóló, stratégiai jelentőségű nemzetközi együttműködéseket és keretmegállapodásokat kötött hétfőn Budapesten.
2026. 03. 02. 19:00
Megosztás:

A japán jen-alapú stabilcoin felforgathatja a pénzügyi és szórakoztatóipart

Stratégiai együttműködés formálja át Japán digitális pénzügyi ökoszisztémáját: a JPYC és a Sony Bank partnersége új korszakot nyithat a stablecoinok tömeges elterjedésében – nemcsak a banki szektorban, hanem a gaming és zeneipari platformokon is.
2026. 03. 02. 18:30
Megosztás:

Tavaszi átfogó élelmiszer-biztonsági és fogyasztóvédelmi ellenőrzések

A húsvéti ünnepek közeledtével a Nemzeti Kereskedelmi és Fogyasztóvédelmi Hatóság (NKFH) és a szakmai irányítása alatt álló kormányhivatalok országos ellenőrzést indítanak a szezonális élelmiszerekre vonatkozó élelmiszer-biztonsági szabályok betartása érdekében. A vizsgálatok kiterjednek a speciális fogyasztói csoportok számára készített termékek jelöléseinek ellenőrzésére is. Sor kerül ezen felül a húsvéti ünnepkörhöz tartozó termékek árfeltüntetésének, valamint az akciós árakra vonatkozó szabályok betartásának vizsgálatára is.
2026. 03. 02. 18:00
Megosztás:

Bitcoin 5 egymást követő piros hónap után: mit üzen a márciusi történelmi átlag a BTC számára?

Soha nem látott negatív széria nyomja a Bitcoint. A piacvezető kriptovaluta 2026 februárjában zsinórban ötödik hónapját zárta mínuszban – ilyen hosszú, megszakítás nélküli havi veszteségsorozatra korábban nem volt példa a teljes historikus adatsorban. A kérdés most az: hozhat-e fordulatot a március, vagy folytatódik a lejtmenet?
2026. 03. 02. 17:30
Megosztás:

Veszélyes rezsim omlik össze Iránban

Iránban ezekben a napokban egy veszélyes rezsim omlik össze, a közel-keleti térségben a következő napok döntő jelentőségűek lesznek - írta Karol Nawrocki lengyel elnök hétfőre virradóan az X-en.
2026. 03. 02. 16:30
Megosztás: