Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Az átlagnál jóval kevesebb csapadék hullott a Balaton vízgyűjtő területén tavaly

A sokévi átlagnál 23 százalékkal kevesebb csapadék hullott a Balaton vízgyűjtő területére tavaly - derül ki a tó vízháztartásáról készített előzetes értékelésben.
2026. 01. 21. 12:00
Megosztás:

Folytatódott a hozamemelkedés a fejlett piacokon

Hétfőt követően kedden ismét érdemben emelkedtek a hozamok a fejlett piacokon. Ehhez a Grönland körüli geopolitikai feszültség és az újabb vámfenyegetések mellett hozzájárult a japán állampapírpiacon folytatódó eladási hullám is, aminek az élelmiszerekre kivetett forgalmi adó eltörlése és a kiírt időközi választás adott újabb löketet.
2026. 01. 21. 11:30
Megosztás:

Vaskos mínuszokkal indult a hét a hosszú hétvége után a Wall Streeten

A hétfői szünnap után a Wall Streetre is elért a Grönland miatti feszültség szele, így 2% körüli mínuszokkal indították a hetet a mértékadó indexek. Az S&P szektorindexei között az alapvető fogyasztási cikkeké kivételével minden pirosba fordult; a legnagyobb, közel 3%-os esés a technológia és a ciklikus fogyasztási cikkek könyvelhették el. A technológiai szektor nagyágyúi, mint a Microsoft, az Nvidia, vagy az Apple is vaskos mínuszokkal zártak, de nagyot esett a Meta, a Google, a Tesla és az Amazon is. A félelemindexként is ismert VIX, amely a várható piaci volatilitást méri, tavaly november óta nem látott szintre, 20 pont fölé emelkedett.
2026. 01. 21. 11:00
Megosztás:

Fokozódik a feszültség az Egyesült Államok Grönland megvásárlásával kapcsolatos tervei miatt

2026 eddig a geopolitikai feszültségek felerősödésének árnyékában telik és jelenleg éppen Grönland felett csapnak össze a hullámok. Ez a téma az uralkodó az idei Davosi Világgazdasági Találkozón, ahol több vezető európai és azon kívüli NATO-tagország politikusa szólalt fel az amerikai ambíciók ellen.
2026. 01. 21. 10:30
Megosztás:

Kedden folytatódott az esés a vezető nyugat-európai tőzsdéken

A mértékadó nyugat-európai tőzsdék hétfőt követően kedden tovább estek a vámfenyegetések miatt. Trump már szombaton kilátásba helyezte, hogy február 1-től nyolc európai ország esetében (Dánia, Norvégia, Svédország, Franciaország, Németország, Hollandia, Finnország, Egyesült Királyság) további 10%-os importvámok lépnek hatályba a már meglévők mellé, amely vámok június 1-jén 25%-ra emelkednek és addig maradnak érvényben, amíg nem engednek Grönland kérdésében. Trump tegnap újabb, ezúttal a francia borokra és pezsgőkre kivetett 200%-os vám bevezetésével fenyegetett azt követően, hogy Emmanuel Macron francia elnök állítólag nem volt hajlandó csatlakozni a Gázával foglalkozó „Béketanácsához”.
2026. 01. 21. 10:00
Megosztás:

Hiába a történelmi csúcsok, csökkent a Bitcoin iránti érdeklődés 2025-ben – Mi állhat a háttérben?

Miközben a Bitcoin 2025-ben új történelmi magasságokat ért el, az online keresések és a közösségi médiás aktivitás meglepő módon visszaesett. A közösségi hangulat továbbra is nyomott 2026-ban, hiába a növekvő árfolyam. Vajon mi magyarázza ezt a különös ellentmondást, és mit jelezhet ez a piac jövőjére nézve?
2026. 01. 21. 09:30
Megosztás:

A NAV nevében adathalászok küldenek csaló e-maileket

A NAV nem küld e-mailt, senki ne dőljön be az adathalászoknak, akik a hét elejétől a NAV nevében küldenek csaló e-maileket - figyelmeztet a Nemzeti Adó- és Vámhivatal szerdai közleményében.
2026. 01. 21. 09:00
Megosztás:

Gyengült a forint szerda reggelre

Gyengült a forint a főbb devizákkal szemben szerda reggel az előző esti jegyzéséhez képest a nemzetközi devizakereskedelemben.
2026. 01. 21. 08:30
Megosztás:

Nagyszabású beruházást indít a Vajda-Papír Csoport Dunaföldváron - Új üzem, automatizált magasraktár és kapacitásbővítés 70,8 milliárd forint értékben

Szijjártó Péter külgazdasági és külügyminiszter jelenlétében 2026. január 20-án helyezték el a Vajda-Papír Csoport harmadik fejlesztési ütemében megvalósuló új üzem és automata raktár alapkövét Dunaföldváron. Az eseményen a magyar tulajdonú Vajda-Papír Csoport négy fejlesztési projektet magában foglaló, nagyszabású bővítési programját jelentették be, amely kiterjed a vállalat kapacitásbővítő beruházására, a hozzá kapcsolódó képzési projektre, a megújuló energiatermelést célzó fejlesztésre, valamint a profitrepatriálás keretében megvalósuló kapacitás bővítő beruházásra.
2026. 01. 21. 08:00
Megosztás:

A SEC biztosának őszinte szavai a kriptopiac jövőjéről

A kriptopiac továbbra is szabályozási útkeresésben van, de az Egyesült Államok Értékpapír- és Tőzsdefelügyeletének (SEC) egyik legismertebb arca, Hester Peirce biztató, mégis kritikus képet festett a jelenlegi helyzetről. Peirce részletesen beszélt a tokenizált értékpapírokról, a SEC és a CFTC közötti hatáskörharcról, valamint a szabályozás jövőjéről — és nem félt kimondani azt sem, ha valami nem működik jól.
2026. 01. 21. 07:30
Megosztás:

Mire elég 40 millió forint a magyar lakáspiacon?

Budapesten átlagosan egy 26 négyzetméteres ingatlanra elég 40 millió forint, a valóságban azonban ennél kisebb lakást lehet vásárolni ennyiből, mivel a minigarzonok többnyire a drága belvárosban találhatók. A zenga.hu ingatlankereső adatai szerint Nógrádban és Békésben ez a keretösszeg egy jó állapotú családi házra is elegendő, míg Szegeden, Győrben, Veszprémben és Székesfehérváron, egy jó minőségű, 45-50 négyzetméteres lakást lehet vásárolni 40 millió forintból.
2026. 01. 21. 07:00
Megosztás:

Az ABB „A” minősítést ért el a CDP rangsorában a víz- és klímavédelem területén

Az ABB kiváló, „A” minősítést ért el a klímavédelem és a vízgazdálkodás területén a CDP nonprofit szervezet 2025-ös rangsorában. Ennek eredményeként a vállalat az éves „A-listán” idén már nemcsak a klímavédelem, hanem – története során először – a felelős vízgazdálkodás terén is helyet kapott. Ezzel az ABB csatlakozott a minősített 22 100 vállalat azon felső 1 százalékához, amelyek „dupla A” értékelést szereztek.
2026. 01. 21. 06:30
Megosztás:

Összeállt a Fishing on Orfű teljes zenei programja

Összeállt az idei Fishing on Orfű (FOO) részletes programja. A 18. fesztiválon az Analog Balaton, az aurevoir., a Bëlga, a Bohemian Betyars, a Carson Coma, a Hiperkarma is színpadra lép június 24. és 27. között - közölte a fesztivál sajtófőnöke hétfőn az MTI-vel.
2026. 01. 21. 05:30
Megosztás:

Stabil pénzügyi pálya és dinamikus növekedés: A Scope Ratings megerősítette a 4IG minősítését

A Scope Ratings hitelminősítő intézet stabil kilátások mellett megerősítette a 4iG Nyrt. adósbesorolását.
2026. 01. 21. 05:00
Megosztás:

Megújulnak a Gondoskodás Pénztárak

Működésében és arculatában is átalakulva megújul a Gondoskodás Egészségpénztár és a Gondoskodás Nyugdíjpénztár, stratégiai szövetségekkel kiegészülve, önálló márkaként jelennek meg az öngondoskodási piacon - közölték a pénztárak kedden az MTI-vel.
2026. 01. 21. 04:30
Megosztás:

2025 tanulságai az építőiparban – a cégtrend tükrében

A 2025-ös év legfontosabb tanulsága az építőiparban, hogy a volumenemelkedés nem jelentett trendfordulót. Bár a piaci teljesítmény javult, a cégszám tovább csökkent, az új alapítások visszafogottak maradtak, miközben a megszűnések tartósan magas szinten alakultak. Az ágazat a 2025. évi szinten maradhat, annak ellenére, hogy a kapacitásai alapján akár 20 %-kal nagyobb teljesítményre is képes lenne.
2026. 01. 21. 04:00
Megosztás:

Minimálisan csökkent 2025-ben a bruttó villamosenergia-forgalom, nőtt a belföldi termelés

A magyarországi bruttó villamosenergia-forgalom 2025-ben 44,613 terawattóra (TWh) volt, 0,3 százalékkal elmaradt a 2024. évi 44,740 terawattórától, ugyanakkor nőtt a belföldi termelés, amely a forgalomban is nagyobb arányt képvisel - derül ki a MAVIR Magyar Villamosenergia-ipari Átviteli Rendszerirányító ZRt. honlapján közzétett adatokból.
2026. 01. 21. 03:30
Megosztás:

Önálló márkaként, stratégiai szövetségesekkel lép szintet Magyarország két meghatározó Pénztára

Új korszak kezdődik a Gondoskodás Egészségpénztár és a Gondoskodás Nyugdíjpénztár életében. A Pénztárak arculatukban és működésükben is megújulnak, miközben stratégiai együttműködések révén erősítik pozíciójukat az öngondoskodási piacon.
2026. 01. 21. 03:00
Megosztás:

Új EU-s vámok érkezhetnek 2026-ban – így alakíthatják át a piacot

A Reuters decemberi beszámolója szerint 2026 júliusától 3 eurós vám terhelheti az alacsony értékű, Európába érkező csomagokat, amivel megszűnhet a korábbi vámmentesség a főként kínai platformokról érkező rendelések esetében. A lépés jelentősen átformálhatja a piaci dinamikát: drágulhatnak az importtermékek, miközben felértékelődhet a hazai logisztika, a fulfillment-szolgáltatások és a gyors kiszállítás szerepe.
2026. 01. 21. 02:30
Megosztás:

Az UniCredit Bank 58,9 millió euró értékű projektfinanszírozást nyújtott a Greenvoltnak Magyarország legnagyobb akkumulátoros energiatároló projektjéhez

A Greenvolt és az UniCredit Bank Hungary Zrt. projektfinanszírozási megállapodást írt alá 58,9 millió euró értékben, több mint tízéves futamidővel. A finanszírozás a Szabolcs-Szatmár-Bereg vármegyei Buj településen építendő, 99 MW/288 MWh kapacitású, önálló akkumulátoros energiatároló rendszer (Battery Energy Storage System: BESS) építését, üzemeltetését és karbantartását támogatja, amely az ország legnagyobb ilyen létesítménye lesz.
2026. 01. 21. 02:00
Megosztás: