Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Kína tízpontos intézkedéscsomagot jelentett be Tajvannal kapcsolatban

A kínai szárazföldi hatóságok tíz intézkedésből álló csomagot jelentettek be a Tajvani-szoroson átívelő kapcsolatok és együttműködés erősítésére – közölte vasárnap a Kínai Kommunista Párt (KKP) Központi Bizottságának tajvani ügyekért felelős hivatala.
2026. 04. 13. 00:05
Megosztás:

Kellemes tavaszi idő várható a jövő héten

A jövő héten kellemes tavaszi idő várható. A hét elején nedves, de enyhe levegő érkezik és melegedés kezdődik, így az éjszakák is fagymentessé válnak, napközben pedig az egyre több napsütés mellett 20 Celsius-fok körüli hőmérséklet várható - derül ki a HungaroMet Zrt. előrejelzéséből, amelyet vasárnap juttattak el az MTI-hez.
2026. 04. 12. 23:00
Megosztás:

ÉLŐ választási eredmények 2026 - 72,44%-os feldolgozottság

A 2026-os országgyűlési választás élő eredményei alapján már a szavazatok közel háromnegyedét feldolgozták: az országos feldolgozottság elérte a 72,44%-ot, ami gyakorlatilag már kirajzolja a végső parlamenti erőviszonyokat.
2026. 04. 12. 21:48
Megosztás:

ÉLŐ választási eredmények 2026 - 60,24%-os feldolgozottság

Tovább frissültek a 2026-os országgyűlési választás élő eredményei: az országos feldolgozottság már 60,24%-on áll, ami alapján egyre biztosabban kirajzolódik a parlamenti erőviszonyok végleges képe.
2026. 04. 12. 21:29
Megosztás:

Megvan a TISZA 2/3 !!! ÉLŐ választási eredmények 2026 - 45,71%-os feldolgozottság

Szenzációs fordulat a 2026-os országgyűlési választás élő eredményeiben: a 45,71%-os feldolgozottság mellett a TISZA párt már elérte a kétharmados többséget a parlamentben (ez még közel sem végleges eredmény).
2026. 04. 12. 21:09
Megosztás:

ÉLŐ választási eredmények 2026 - 37,04%-os feldolgozottság

A 2026-os országgyűlési választás élő eredményei alapján már közel a szavazatok harmadát feldolgozták: az országos feldolgozottság elérte a 37,04%-ot, és az eddigi adatok egyre stabilabb politikai erőviszonyokat mutatnak.
2026. 04. 12. 21:01
Megosztás:

Trump: a Hormuzi-szoroson vagy minden hajó áthalad, vagy egyetlen egy sem

Az Egyesült Államok a "mindent, vagy semmit" megközelítést alkalmazza a Hormuzi-szorosnál, azaz vagy minden hajó áthalad, vagy egyetlen egy sem - ismertette vasárnap Donald Trump amerikai elnök a hajózási útvonalra bejelentett teljes tengeri blokáddal kapcsolatosan.
2026. 04. 12. 21:00
Megosztás:

Friss, ÉLŐ választási eredmények 2026 - 29,21%-os feldolgozottság

Folyamatosan frissülnek a 2026-os országgyűlési választás élő eredményei, és az eddigi adatok alapján egyre határozottabb tendencia bontakozik ki. Az országos feldolgozottság jelenleg 29,21%, ami már jelentősebb mintát ad a várható parlamenti erőviszonyokról.
2026. 04. 12. 20:49
Megosztás:

ÉLŐ választási eredmények 2026 - 21,54%-os feldolgozottság

Újabb jelentős frissítés érkezett a 2026-os országgyűlési választásokról: az országos feldolgozottság elérte a 21,54%-ot, és az eddigi adatok alapján tovább erősödik a vezető erő pozíciója.
2026. 04. 12. 20:39
Megosztás:

ÉLŐ választási eredmények 2026 - 14,72%-os feldolgozottság

Tovább frissültek a 2026-os országgyűlési választás adatai: az országos feldolgozottság már 14,72%-on áll, és az eddigi eredmények egyre markánsabb képet rajzolnak ki.
2026. 04. 12. 20:33
Megosztás:

ÉLŐ választási eredmények 2026 - 6,56%-os feldolgozottság

Megérkeztek az első hivatalos adatok a 2026-os országgyűlési választásokról: az országos feldolgozottság jelenleg 6,56%-on áll, és már most kirajzolódni látszanak az erőviszonyok.
2026. 04. 12. 20:21
Megosztás:

Hivatalosan befejeződött a szavazás, így zajlik a számlálás

Vasárnap este hét órakor hivatalosan befejeződött a szavazás az ország 3154 településén és a 23 budapesti kerületben kialakított 10 047 szavazókörben az országgyűlési választáson.
2026. 04. 12. 20:00
Megosztás:

Közel félmilliárd forintot fordít a Budapest Airport a repülőtér környéki intézmények zajvédelmére-

Ezzel párhuzamosan elindult a repülőtér-üzemeltető által 3 milliárd forintból finanszírozott lakossági zajvédelmi program hatodik üteme 250 millió forint összegű adományt adott át ma a VINCI hálózat részeként működő Budapest Airport a Heim Pál Országos Gyermekgyógyászati Intézetnek. A támogatás egy átfogó zajvédelmi stratégia része: a most átadott adományon felül a Budapest Airport további 220 millió forintot fordít intézményi zajszigetelésre annak érdekében, hogy a repülőtér környezetében működő iskolák, óvodák és egyéb közintézmények zajterhelését csökkentse.
2026. 04. 12. 18:00
Megosztás:

Ismert kockázatok, elmaradt lépések: hogyan jutott ide a magyar energiapolitika

Míg az Európai Unió és a régió országai csökkentették az orosz energiafüggőséget, Magyarország továbbra is nagymértékben a Barátság vezetéken érkező kőolajra támaszkodik, miközben az Adria vezeték körüli viták sem rendeződtek. Az elmúlt évek döntései nyomán beszűkült a mozgástér, és az ellátásbiztonságot érintő kockázatok csak növekedtek. Ráadásul a téma annyira átpolitizálódott, hogy egyelőre egyik nagy párt sem ígér átfogó és meggyőző megoldást. Perger András, az Energiaklub energiaprogram-vezetője szerint a rövid távú szempontok háttérbe szorították a stratégiai gondolkodást, aminek következményei egyre inkább kézzelfoghatóvá válnak.
2026. 04. 12. 17:00
Megosztás:

Stabilcoin boom: mely hálózatok és tokenek lehetnek a legnagyobb nyertesek?

A stabilcoin-piac potenciális robbanása – akár a 719 billió dolláros, sőt extrém esetben az 1,5 kvadrillió dolláros éves volumen – alapjaiban rajzolhatja át a blokklánc-ökoszisztémák erőviszonyait. Fontos azonban tisztázni: nem minden hálózat profitál egyformán. A kulcs a skálázhatóság (scalability), alacsony díjak (low fees), szabályozási kompatibilitás (compliance) és a valós fizetési integráció (real-world payments adoption).
2026. 04. 12. 16:00
Megosztás:

Megszűntek a madárinfluenza miatt korlátozott körzetek Magyarországon

A Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) feloldotta a madárinfluenza miatt fennálló utolsó megfigyelési körzeteket is, így jelenleg nincs hazánkban korlátozás alá eső terület. Ugyanakkor a vadon élő madarakban a vírus továbbra is jelen lehet, ezért a járványvédelmi intézkedések betartása kiemelten fontos.
2026. 04. 12. 15:00
Megosztás:

Robban a stabilcoin piac: 719 billió dolláros forgalom jöhet 2035-re

A stabilcoinok (stablecoins) már nem csupán kriptokereskedési eszközök – a következő évtizedben a globális fizetési infrastruktúra egyik alapkövévé válhatnak. Egy friss iparági előrejelzés szerint a piac volumene akár elképesztő magasságokba is emelkedhet.
2026. 04. 12. 14:00
Megosztás:

Geopolitikai feszültségek rázták meg a kriptopiacot – esett a Bitcoin és az altcoinok

A nemzetközi diplomáciai kudarcok ismét rávilágítottak arra, mennyire érzékeny a kriptovaluta-piac a geopolitikai eseményekre. A Bitcoin árfolyama gyors visszaesést mutatott, miközben a befektetők kockázatkerülő üzemmódba kapcsoltak.
2026. 04. 12. 13:00
Megosztás:

Jelentős segítség érkezik a gazdasági nehézségekkel küzdő hízósertés ágazatnak

Újabb jelentős segítség érkezik a gazdasági nehézségekkel küzdő hízósertés ágazatnak - közölte az Agrárminisztérium (AM) pénteken az MTI-vel.
2026. 04. 12. 12:00
Megosztás:

Orbán győzelmét jósolja az amerikai közvéleménykutatás

Orbán Viktor győzelmére számít, és úgy véli, hogy a Fidesz megszerzi a parlamenti többséget – erről beszélt John McLaughlin amerikai közvélemény-kutató a Patrióta YouTube-csatorna szombaton megjelent videójában.
2026. 04. 12. 11:00
Megosztás: