Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Összeállt a Fishing on Orfű teljes zenei programja

Összeállt az idei Fishing on Orfű (FOO) részletes programja. A 18. fesztiválon az Analog Balaton, az aurevoir., a Bëlga, a Bohemian Betyars, a Carson Coma, a Hiperkarma is színpadra lép június 24. és 27. között - közölte a fesztivál sajtófőnöke hétfőn az MTI-vel.
2026. 01. 21. 05:30
Megosztás:

Stabil pénzügyi pálya és dinamikus növekedés: A Scope Ratings megerősítette a 4IG minősítését

A Scope Ratings hitelminősítő intézet stabil kilátások mellett megerősítette a 4iG Nyrt. adósbesorolását.
2026. 01. 21. 05:00
Megosztás:

Megújulnak a Gondoskodás Pénztárak

Működésében és arculatában is átalakulva megújul a Gondoskodás Egészségpénztár és a Gondoskodás Nyugdíjpénztár, stratégiai szövetségekkel kiegészülve, önálló márkaként jelennek meg az öngondoskodási piacon - közölték a pénztárak kedden az MTI-vel.
2026. 01. 21. 04:30
Megosztás:

2025 tanulságai az építőiparban – a cégtrend tükrében

A 2025-ös év legfontosabb tanulsága az építőiparban, hogy a volumenemelkedés nem jelentett trendfordulót. Bár a piaci teljesítmény javult, a cégszám tovább csökkent, az új alapítások visszafogottak maradtak, miközben a megszűnések tartósan magas szinten alakultak. Az ágazat a 2025. évi szinten maradhat, annak ellenére, hogy a kapacitásai alapján akár 20 %-kal nagyobb teljesítményre is képes lenne.
2026. 01. 21. 04:00
Megosztás:

Minimálisan csökkent 2025-ben a bruttó villamosenergia-forgalom, nőtt a belföldi termelés

A magyarországi bruttó villamosenergia-forgalom 2025-ben 44,613 terawattóra (TWh) volt, 0,3 százalékkal elmaradt a 2024. évi 44,740 terawattórától, ugyanakkor nőtt a belföldi termelés, amely a forgalomban is nagyobb arányt képvisel - derül ki a MAVIR Magyar Villamosenergia-ipari Átviteli Rendszerirányító ZRt. honlapján közzétett adatokból.
2026. 01. 21. 03:30
Megosztás:

Önálló márkaként, stratégiai szövetségesekkel lép szintet Magyarország két meghatározó Pénztára

Új korszak kezdődik a Gondoskodás Egészségpénztár és a Gondoskodás Nyugdíjpénztár életében. A Pénztárak arculatukban és működésükben is megújulnak, miközben stratégiai együttműködések révén erősítik pozíciójukat az öngondoskodási piacon.
2026. 01. 21. 03:00
Megosztás:

Új EU-s vámok érkezhetnek 2026-ban – így alakíthatják át a piacot

A Reuters decemberi beszámolója szerint 2026 júliusától 3 eurós vám terhelheti az alacsony értékű, Európába érkező csomagokat, amivel megszűnhet a korábbi vámmentesség a főként kínai platformokról érkező rendelések esetében. A lépés jelentősen átformálhatja a piaci dinamikát: drágulhatnak az importtermékek, miközben felértékelődhet a hazai logisztika, a fulfillment-szolgáltatások és a gyors kiszállítás szerepe.
2026. 01. 21. 02:30
Megosztás:

Az UniCredit Bank 58,9 millió euró értékű projektfinanszírozást nyújtott a Greenvoltnak Magyarország legnagyobb akkumulátoros energiatároló projektjéhez

A Greenvolt és az UniCredit Bank Hungary Zrt. projektfinanszírozási megállapodást írt alá 58,9 millió euró értékben, több mint tízéves futamidővel. A finanszírozás a Szabolcs-Szatmár-Bereg vármegyei Buj településen építendő, 99 MW/288 MWh kapacitású, önálló akkumulátoros energiatároló rendszer (Battery Energy Storage System: BESS) építését, üzemeltetését és karbantartását támogatja, amely az ország legnagyobb ilyen létesítménye lesz.
2026. 01. 21. 02:00
Megosztás:

Hatmilliárd forint kormányzati támogatást kap Miskolc

Hatmilliárd forint vissza nem térítendő kormányzati támogatást kap Miskolc, hogy visszaszerezze a Diósgyőri Acélművek (DAM) teljes területét - közölte kedden az MTI-vel a vármegyeszékhely sajtóosztálya.
2026. 01. 21. 01:30
Megosztás:

Jó sok gázt fogyasztanak Romániában

Ötéves rekordszinten van a gázfogyasztás Romániában - írja a profit.ro a Transgaz adatai alapján.
2026. 01. 21. 01:00
Megosztás:

A kormány újabb százmilliárd forintos programot jelentett be

Hat lépésből álló intézkedéscsomagot fogadott el a kormány a hazai vendéglátás megsegítésére, a nemzetgazdasági miniszter bejelentése szerint mintegy százmilliárd forint rendkívüli támogatással segítik az éttermeket - írta a Magyar Nemzet kedden Nagy Márton Facebook-oldalára hivatkozva.
2026. 01. 21. 00:30
Megosztás:

Két körözött magyar bűnözőt fogtak el külföldön

Hollandiában, illetve Ausztriában fogtak el kábítószer-kereskedelem, és más bűncselekmények miatt körözött magyar bűnözőket - közölte a rendőrség honlapján kedden.
2026. 01. 21. 00:05
Megosztás:

5,5 millió XTZ vásárlásával lépett szintet a TenX – Stakelési bevételekre hajt a Tezos blokkláncon

A blokklánc-infrastruktúrára specializálódott TenX Protocols újabb lépést tett a stakingalapú bevételszerzés irányába: a vállalat 5,5 millió Tezos (XTZ) tokent vásárolt stratégiai partnerség keretében. A cél nem más, mint stabil, visszatérő bevétel generálása saját validátori tevékenységgel – miközben a decentralizáció, megbízhatóság és transzparencia a fő értékei maradnak. De miért pont Tezos, és mit jelent ez az iparág számára?
2026. 01. 20. 23:30
Megosztás:

Ismét több ezer gazda tüntetett Strasbourgban

Ismét több ezer gazda tüntetett az Európai Parlament előtt az uniós agrártámogatások elvonása, az elhibázott kereskedelempolitikai lépések és a jogbiztonság hiánya miatt - közölte a Nemzeti Agrárgazdasági Kamara (NAK) kedden az MTI-vel.
2026. 01. 20. 23:00
Megosztás:

Top 5 passzív jövedelmet kínáló lehetőség: Miért a Digitap ($TAP) a legjobb kriptó 2026-ra?

A passzív jövedelmi lehetőségek a kriptovilágban soha nem voltak ennyire elérhetők. A piac ma már olyan staking hozamokat kínál, amelyek messze meghaladják a hagyományos megtakarítási számlák kamatait. Ez az összeállítás olyan projekteket emel ki, amelyek erős fundamentumokat ötvöznek valós hozamtermelő potenciállal.
2026. 01. 20. 22:00
Megosztás:

Románia lakosságának hetven százaléka nem bízik az igazságszolgáltatásban

Romániában a lakosság 70 százaléka kevéssé, nagyon kevéssé vagy egyáltalán nem bízik az igazságszolgáltatásban, ugyanakkor 92 százalékuk fontosnak tartja az igazságszolgáltatás függetlenségét - derül ki az INSCOP Research kedden ismertetett felméréséből.
2026. 01. 20. 21:30
Megosztás:

A Norvégiából hazahozott profitjából építi új gyárát Dunaföldváron a Vajda-Papír

A Norvégiából hazahozott profitjából építi új gyárát Dunaföldváron a Vajda-Papír, a beruházást a kormány 25 milliárd forinttal támogatja – mondta a külgazdasági és külügyminiszter kedden, az üzem alapkőletételi ünnepségén.
2026. 01. 20. 21:00
Megosztás:

Németországban és az euróövezetben is javultak a gazdasági várakozások januárban

Januárban a ZEW gazdaságkutató intézet németországi és euróövezeti gazdasági hangulatindexe is javult az előző havihoz képest.
2026. 01. 20. 20:30
Megosztás:

Legjobb kriptós előértékesítés 2026-ban? Miért teljesít jobban a Digitap ($TAP) 4 millió dolláros tőkebevonása, mint a 1,76 dolláros SUI?

Vegyesen indult az új év a kriptopiac számára, számos altcoin küzd a lendület megtartásáért. Például a Sui (SUI) az év első két hetében erősödni tudott, azonban második jelentős hálózati leállását követően a token értéke erőteljesen visszaesett.
2026. 01. 20. 20:00
Megosztás:

Négyszáz új munkavállaló felvételére toborzást indít Debrecenben az EVE Power Hungary

Az EVE Power Hungary Kft. január végén toborzási kampányt indít Debrecenben és a környező településeken: mintegy 400 új munkavállaló, elsősorban technikus, mérnök és támogató munkatárs felvételét tervezik az épülő debreceni gyárukba, amely a BMW Group beszállítója - jelentették be a gyár vezetői kedden sajtótájékoztatón.
2026. 01. 20. 19:00
Megosztás: