Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Hatályba lépett Romániában az önkéntes katonai szolgálat bevezetésének jogi kerete

Hatályba lépett Romániában az önkéntes katonai szolgálat bevezetésének jogi kerete, miután Nicusor Dan államfő kihirdette a honvédelmi felkészítésről szóló törvény módosítását - közölte kedden a Digi24.ro hírportál.
2026. 01. 13. 19:30
Megosztás:

Menesztette az ukrán parlament a védelmi minisztert

Az ukrán parlament megszavazta kedden Denisz Smihal felmentését a védelmi miniszteri tisztségéből - számoltak be ukrán hírügynökségek.
2026. 01. 13. 19:00
Megosztás:

Így nőttek tavaly az árak Magyarországon

2025. decemberben a fogyasztói árak átlagosan 3,3 százalékkal haladták meg az egy évvel korábbiakat, 0,1 százalékkal pedig az előző haviakat. 2025-ben átlagosan 4,4 százalékkal emelkedtek az árak az előző évhez képest - közölte a Központi Statisztikai Hivatal (KSH) kedden.
2026. 01. 13. 18:30
Megosztás:

Közép- és Kelet-Európa 2026-ban is a kontinens egyik leggyorsabban növekvő régiója

Közép- és Kelet-Európa 2026-ban várhatóan lehagyja Nyugat-Európát: a gazdasági növekedés, a beruházások és a háztartások vagyonának gyarapodása új lendületet vesz
2026. 01. 13. 18:00
Megosztás:

Nyomás az ALDI-ba vásárolni, ilyen ritkán van, mint most…

Az ALDI tovább folytatja az árcsökkentést: 12-féle friss sertéshús árát mérsékli 2026. január 15-től, átlagosan több mint 7%-kal. Az ALDI az egy héttel korábbi tejtermék-árcsökkentési intézkedése után januárban már második alkalommal mérsékli számos termék fogyasztói árát.
2026. 01. 13. 17:30
Megosztás:

Csökken az infláció, de az év eleji adatokat még látni kellene a kamatcsökkentéshez

Tovább mérséklődött az infláció decemberben, a novemberi 3,8% után a fogyasztói árak decemberben 3,3%-kal haladták meg az egy évvel korábbi szintet idehaza, ami megfelelt várakozásunknak és az elemzői konszenzusnak.
2026. 01. 13. 17:00
Megosztás:

Budapest Airport: extrém időjárással szembesültek a Liszt Ferenc nemzetközi repülőtéren

Extrém időjárási körülményekkel szembesültek kedden a hajnali órákban a budapesti repülőtéren, hajnal három óra óta havazott, majd ez a kora reggeli órákban ónos esőre váltott a reptér környezetében is, ezért 10 óra 25 perckor elrendelték biztonsági okok miatt a repülőtérzárat, majd 13 órakor mindkét pályával újra nyitott a légikikötő - mondta Valentínyi Katalin, a Budapest Airport kommunikációs és kormányzati kapcsolatok vezérigazgató-helyettese a Liszt Ferenc repülőtéren tartott sajtótájékoztatón.
2026. 01. 13. 16:30
Megosztás:

Árkorrekció mellett is erős maradt a lakáshitelezés

Rekordaktivitás jellemezte a lakáshitelezési piacot 2025-ben: a lakáscélú jelzáloghitelek volumene megközelítette a 2000 milliárd forintot, ami 48 százalékkal haladja meg az előző év szintjét. A jelentős bővülés úgy ment végbe, hogy közben 2025 utolsó negyedévében az ingatlanpiacon már árkorrekció és mérsékeltebb forgalom volt tapasztalható – ez a kettősség új szakaszba lépő piacot jelez a Credipass szakértői szerint.
2026. 01. 13. 15:30
Megosztás:

A magyar házak rejtett válsága: amikor az aszály már az otthonokat veszélyezteti

Az elmúlt évek extrém aszályos időszakai nemcsak a mezőgazdaságot, hanem egyre több magyar lakóingatlant is érintenek. Szakemberek szerint csendes, de országos léptékű épületkárosodási folyamat zajlik, amelynek jeleit sok tulajdonos még mindig alábecsüli vagy félreérti.
2026. 01. 13. 15:00
Megosztás:

A Bitcoin szuperciklus küszöbén állhat – új korszak kezdődik a kriptopiacon?

A Fidelity szerint a Bitcoin történelmi négyéves ciklusai megváltozhatnak, és a piac egy új, úgynevezett „szuperciklusba” léphet. Ez az új szakasz hosszabb, tartósabb csúcsokat és enyhébb visszahúzódásokat hozhat – szakítva a korábbi halvingszabályokkal.
2026. 01. 13. 14:30
Megosztás:

Megindult a kőolajszállítás Szerbiába Horvátország felől

Kedd éjszaka megindult a kőolajszállítás az Adria-kőolajvezetéken (JANAF) keresztül a pancsovai finomítóba.
2026. 01. 13. 14:00
Megosztás:

Wizz Air: folyamatosan figyeljék a járatinformációkat az utasok

A Wizz Air több járatát is érintette a rendkívüli időjárási helyzet, kedden délelőtt a légitársaság 5, Ferihegyre tartó repülőgépe kényszerült másik repülőtéren landolni, a még el nem indított, Budapestre tartó járatok pedig a kiinduló állomáson várakoznak, amíg a gép budapesti fogadása nem biztosított. A légitársaság arra kéri az utasait, hogy akik közvetlenül a Wizz Airnél foglaltak, folyamatosan figyeljék a mobilalkalmazásban, e-mailen, SMS-ben érkező járatinformációkat.
2026. 01. 13. 13:30
Megosztás:

Nógrád vármegyében is megjelent a madárinfluenza

Nógrád vármegyében egy tenyészlúd-tartó telepen magas patogenitású madárinfluenza vírus jelenlétét igazolta a Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) laboratóriuma. Az érintett állomány felszámolása folyamatban van. Kiemelten fontos a járványügyi előírások maradéktalan betartása hazánkban.
2026. 01. 13. 13:00
Megosztás:

Operatív törzs: keleten jelentősebb havazás, nyugaton inkább eső várható kedden

A Budapest-Békéscsaba tengelytől keletre jelentős havazásra lehet számítani kedden napközben, ettől nyugatabbra eső fordulhat elő - mondta a HungaroMet Zrt. vezérigazgatója az operatív törzs kedd délelőtti sajtótájékoztatóján Budapesten.
2026. 01. 13. 12:30
Megosztás:

Ezért veri meg a Xiaomi az Apple-t és a Samsungot 2026-ban

A Xiaomi 2026-ra a világ egyik legmeghatározóbb technológiai vállalatává válhat, miközben az Apple és a Samsung kénytelen lesz alkalmazkodni a kínai óriás tempójához. A pekingi székhelyű cég nemcsak okostelefonokat gyárt, hanem egy teljes ökoszisztémát épít, amely az elektromos autóktól a viselhető eszközökig terjed. Lei Jun, a vállalat alapítója öt évvel ezelőtt még úgy érezte, hogy az Apple és a Samsung legyőzhetetlen hegyek, ma viszont már magabiztosan veszi fel a versenyt velük.
2026. 01. 13. 12:00
Megosztás:

Hoskinson ultimátuma: az USA vezetése elveszítheti a kriptó jövőjét, ha nem lép időben

Charles Hoskinson, a Cardano alapítója és a kriptovaluta-ipar egyik legismertebb alakja, kemény kritikával illette az amerikai kormányzat kriptopénzekkel kapcsolatos politikáját. Véleménye szerint az Egyesült Államok politikai vezetése alkalmatlannak tűnik arra, hogy időben elfogadja a szükséges szabályozási kereteket. Ha a döntéshozók továbbra is késlekednek, Hoskinson szerint az ország végleg elveszítheti a lehetőséget arra, hogy érdemi szerepet töltsön be a globális kriptoforradalomban.
2026. 01. 13. 11:30
Megosztás:

Tavaly nőtt a chipgyártók bevétele

Tavaly 793,4 milliárd dollár értékben adtak el félvezetőket világszerte, ami 21 százalékos növekedés 2024-hez képest - áll a Gartner amerikai technológiai piackutató honlapjára hétfőn fölkerült jelentésben.
2026. 01. 13. 11:00
Megosztás:

A magyar cégek több mint negyedénél bevált a távmunka

A magyar vállalkozások 27 százaléka biztosítja az otthoni munkavégzés lehetőségét dolgozói legalább egy részének, és a cégek háromnegyede a következő egy-két évben sem tervezi ennek megváltoztatását - derül ki a GKI Gazdaságkutató Zrt. MTI-nek küldött felméréséből.
2026. 01. 13. 10:30
Megosztás:

Megaways vs klasszikus nyerőgépek – Melyik fizet jobban?

A válasz nem egyértelmű, mert mindkét típus más játékstílushoz és kockázatvállalási hajlandósághoz illik. A Megaways nyerőgépek magas volatilitásuknak köszönhetően ritkábban, de nagyobb összegeket fizetnek ki, míg a klasszikus 3 tárcsás gépek gyakoribb, kisebb nyereményekkel jutalmazzák a játékosokat. Az RTP (visszatérítési arány) mindkét kategóriában 95-98% között mozog, tehát hosszú távon hasonló megtérülésre számíthatsz.
2026. 01. 13. 10:21
Megosztás:

Gyanús indulás a NYC Token körül – Eric Adams volt polgármester és a „rug pull” vádak

Komoly viharokat kavart a közelmúltban bemutatott „NYC Token”, amely mögött nem más áll, mint New York korábbi polgármestere, Eric Adams. Bár a projektet a blokklánc technológia társadalmi hasznosítására hivatkozva indították, az on-chain adatok alapján sokak szerint inkább egy gyanús „rug pull” lehetett a háttérben.
2026. 01. 13. 10:00
Megosztás: