Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Proof of Work vs. „Proof of War”: Bitcoin biztonság kontra fiat pénzrendszer

A Bitcoin energiaalapú biztonsági modellje és a fiat pénzek politikavezérelt működése közötti különbség újra a szakmai viták középpontjába került. A „proof of work” és a „proof of war” kifejezések éles retorikai ellentétet rajzolnak fel a digitális, decentralizált pénz és az államilag kibocsátott valuta között – miközben az energiaárak, az infláció és a monetáris politika aktuális kérdései tovább fűtik a diskurzust.
2026. 03. 01. 06:00
Megosztás:

A Nébih tipp: ideje rendet tenni a hűtőben és a kamrában

A tavasz közeledte jó alkalom arra, hogy a hűtőszekrényt és kamrát is átvizsgáljuk, rendbe tegyük. A Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) Oktatási Program praktikus tanácsokkal hívja fel a figyelmet a rendszeres ellenőrzés és takarítás fontosságára. A helyes élelmiszer-elrendezés mind az élelmiszerbiztonság, mind az élelmiszerpazarlás csökkentése szempontjából alapvető.
2026. 03. 01. 05:00
Megosztás:

Begyújtotta a rakétákat a 4iG: Soha nem látott pénzügyi eredményeket ért el a cégcsoport

A 4iG Csoport történetének legerősebb pénzügyi évét zárta 2025-ben: konszolidált nettó árbevétele 733,88 milliárd forintra, EBITDA-ja 275 milliárd forintra emelkedett, mindkettő történelmi csúcsot jelent.
2026. 03. 01. 04:00
Megosztás:

Befejeződött a Bászna Gabona Zrt. károsultjainak állami kárrendezése

A kormány gyors reakciójának köszönhetően másfél hónap alatt a pénzükhöz juthattak a Bászna Gabona Zrt. károsultjai - jelentette be közösségi oldalán Nagy István agrárminiszter a tárca által az MTI-hez szombaton eljuttatott közlemény szerint.
2026. 03. 01. 03:00
Megosztás:

Ennyi lesz a liszt, a cukor, az étolaj és a tojás ára márciustól

Az üzletekben tapasztalható árváltozások most jóval visszafogottabbak, mint a korábbi, erőteljes inflációs időszakban. Ez azonban nem jelenti azt, hogy teljesen mindegy lenne, mikor és melyik boltban tesszük a kosárba az alapélelmiszereket.
2026. 03. 01. 02:00
Megosztás:

Kevés a nyugdíjad? Így lehet emelést kérni hivatalos úton

Sokan csak akkor szembesülnek vele, mennyire alacsony az ellátásuk, amikor már hónapok óta próbálnak kijönni a pénzből. Pedig a nyugdíjrendszer nem zárja ki teljesen a segítséget: méltányossági alapon többféle támogatás is kérhető. Mutatjuk, milyen lehetőségek állnak rendelkezésre, ha kevésnek érzed a nyugdíjadat.
2026. 03. 01. 01:00
Megosztás:

Városi épületfejlesztést segítő algoritmust fejlesztett az EFERTE Kft.

Tartószerkezetet vizsgáló döntéstámogató algoritmust és hozzá kapcsolódó adatbázist fejlesztett az EFERTE Mérnöki Tanácsadó és Szolgáltató Kft. a meglévő városi épületek fejlesztésének segítésére, a 257,6 millió forint összköltségvetésű projekt a Nemzeti Kutatási, Fejlesztési és Innovációs Hivataltól kapott 199,9 millió forint vissza nem térítendő támogatás segítségével valósult meg - közölte az EFERTE Kft. az MTI-vel.
2026. 03. 01. 00:05
Megosztás:

Drasztikus áremelkedést idézne elő a Hormuzi-szoros lezárása

Drasztikus áremelkedést idézne elő a Hormuzi-szoros lezárása, ott halad át a világ nyersolaj-kereskedelmének mintegy harmada - mondta a Századvég Konjunktúrakutató Zrt. energia- és klímapolitikai üzletágának vezetője szombaton az M1 aktuális csatorna műsorában.
2026. 02. 28. 23:00
Megosztás:

Ezekkel a számokkal nyerhettél az ötös lottón!

A Szerencsejáték Zrt. tájékoztatása szerint a 9. héten megtartott ötös lottó és Joker számsorsoláson a következő számokat húzták ki:
2026. 02. 28. 22:00
Megosztás:

Pozitívról stabilra módosította Szerbia adósosztályzatának kilátását a Moodys

A felminősítés lehetőségére utaló eddigi pozitívról stabilra módosította Szerbia adósosztályzatának kilátását a Moody's Ratings. A nemzetközi hitelminősítő elsősorban azzal a véleményével indokolta a negatív korrekciót, hogy a szerbiai politikai kockázatok jelentős erősödése a korábban vártnál nagyobb visszahúzó erőt gyakorol a szerb gazdaság növekedésére, és lefulladt a szerb EU-csatlakozási folyamat is.
2026. 02. 28. 21:00
Megosztás:

Nem kezdődött el a harmadik világháború, de új korszak kezdődik

Aleksandar Vucic szerb államfő szerint a közel-keleti konfliktus nem jelenti a harmadik világháború kezdetét, ugyanakkor a világ olyan új korszakba lép, amelyben a nemzetközi jog egyre kevésbé lesz meghatározó. Úgy vélte, jelentősen emelkedhet az olaj ára is.
2026. 02. 28. 20:00
Megosztás:

1,71 milliárd dolláros kriptobányászati veszteség után irány az AI: új pályára áll a MARA?

Brutális negyedéves mínuszt jelentett a MARA Holdings, miután a Bitcoin árfolyamesése letarolta a mérleget. A cég azonban nem csupán túlélni akar: mesterséges intelligencia-adatközpontokkal és egy francia energetikai óriás leányvállalatával közösen teljesen új üzleti modellt építene.
2026. 02. 28. 19:00
Megosztás:

Több mint negyvenezer fiatalt hozott helyzetbe az Otthon Start program

A lakásvásárlást tekintve több mint negyvenezer fiatalt hozott helyzetbe az Otthon Start hitelprogram - közölte a Miniszterelnökség parlamenti és stratégiai államtitkára a program bevezetése óta eltelt hat hónap eredményeit ismertetve szombaton Debrecenben.
2026. 02. 28. 18:00
Megosztás:

Iráni konfliktus - Kína a katonai műveletek azonnali leállítását sürgeti

Kína nagyfokú aggodalmát fejezte ki az Izrael és az Egyesült Államok által Irán ellen végrehajtott légitámadások miatt, és a katonai műveletek leállítását sürgeti - közölte szombaton a kínai külügyminisztérium.
2026. 02. 28. 17:00
Megosztás:

Több mint 531 milliárd SHIB áramlott a tőzsdékre – Komoly nyomás alá került a Shiba Inu árfolyama

A Shiba Inu ismét kritikus ponthoz érkezett. Az on-chain adatok szerint egyetlen nap alatt több mint 531 milliárd SHIB token került kriptotőzsdékre, ami erős eladói nyomásra utal. A technikai kép továbbra is gyenge, a hétvégi alacsony likviditás pedig felerősítheti az árfolyammozgásokat.
2026. 02. 28. 16:00
Megosztás:

Megközelítette a 4 milliárd forintot a CIG Pannónia nyeresége tavaly

A CIG Pannónia Életbiztosító Nyrt. 59,7 milliárd forintos díjbevétel mellett 3,958 milliárd forint adózott eredménnyel zárt tavaly - közölte a társaság pénteken az MTI-vel.
2026. 02. 28. 15:00
Megosztás:

A Leapmotor kínai autómárka gyors ütemben bővíti hálózatát Európában

A Leapmotor kínai autómárka a Stellantis kiterjedt márkakereskedői hálózatába integrálódva gyors ütemben erősíti európai jelenlétét - tájékoztatta a C Automobil Import Kft. az MTI-t szombaton.
2026. 02. 28. 14:00
Megosztás:

80 ezer BTC visszaszerzése hard forkkal? Mark Karpeles vitatott javaslata felforgathatja a Bitcoint

Egy minden eddiginél merészebb ötlet rázta meg a kriptoközösséget: a csődbe ment Mt. Gox egykori vezérigazgatója, Mark Karpeles egy egyszeri Bitcoin hard fork végrehajtását javasolja annak érdekében, hogy visszaszerezzen közel 80 000 BTC-t egy 2011-es hackből. A terv nemcsak technikai, hanem filozófiai szempontból is alapjaiban kérdőjelezi meg a Bitcoin egyik legszentebb elvét: a megváltoztathatatlanságot (immutability).
2026. 02. 28. 13:00
Megosztás:

A gyógyszerpiac versenyjogi kihívásairól tartott szemináriumot a GVH és az OECD közös budapesti oktatási központja, Budapesten

A Gazdasági Versenyhivatal (GVH) és a Gazdasági Együttműködési és Fejlesztési Szervezet (OECD) közösen működtetett Versenyügyi Regionális Oktatási Központja (ROK) a gyógyszerpiac versenyjogi kérdéseiről szervezett szemináriumot. A háromnapos szakmai eseményen közel 20 ország versenyhatósági szakértői vettek részt. A GVH aktívan foglalkozik a gyógyszerpiacokon felmerülő versenyjogi problémákkal, nemrég két versenyfelügyeleti eljárást is indított versenykorlátozás, illetve erőfölénnyel való visszaélés gyanújával.
2026. 02. 28. 12:00
Megosztás:

A Wizz Air felfüggesztette izraeli, dubaji, abu-dzabi és ammani járatait

A közel-keleti helyzet eszkalálódása miatt a Wizz Air azonnali hatállyal felfüggesztette minden izraeli, dubaji, abu-dzabi és ammani járatát - közölte a Wizz Air Magyarország szombaton az MTI-vel, jelezve: az intézkedés legalább március 7-ig érvényben marad.
2026. 02. 28. 11:00
Megosztás: