Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Sokkoló igazság a kutyák életkoráról: lehet, hogy a kutyád már „nyugdíjas”, csak nem tudsz róla?

A legtöbb gazdi úgy gondolja, hogy pontosan tudja, hány éves a kutyája. De biztos benne, hogy azt is tudja, ez mit jelent emberi léptékben? Könnyen lehet, hogy egy vidám, játszós eb valójában már a „középkor” végén jár – vagy épp ellenkezőleg: még messze nem számít idősnek, hiába tűnik annak első pillantásra.
2026. 02. 07. 00:01
Megosztás:

Emelkedéssel zártak a New York-i tőzsde főbb mutatói

Jelentős emelkedéssel zártak pénteken a New York-i értéktőzsde irányadó mutatói, a 30 vezető iparvállalat Dow Jones indexe történelme során most először lépte át az 50 ezer pontot.
2026. 02. 06. 23:00
Megosztás:

Zárul a „Minden vállalkozásnak legyen saját honlapja” program második üteme

A Demján Sándor Program keretében megvalósuló „Minden vállalkozásnak legyen saját honlapja” program második üteme a rendelkezésre álló források kimerülése miatt 2026. február 6-án 18 órakor lezárul.
2026. 02. 06. 22:00
Megosztás:

150 darab legalább milliós nyereményt kínál az új, Varázsvilág sorsjegycsalád

A farsangi időszakra időzítve jelenik meg az év első háromtagú sorsjegycsaládja: a Varázskamra, Varázsrengeteg és Varázsvilág. A sorsjegyek mágikus külsővel, egyszerű, ám dinamikus játékmenetekkel és több tízmilliós főnyereményekkel várják a játékosokat.
2026. 02. 06. 21:00
Megosztás:

Erősödött a forint péntekre

Erősödött a forint a főbb devizákkal szemben péntek kora estére a bankközi devizapiacon reggelhez képest.
2026. 02. 06. 20:00
Megosztás:

A Strategy 2,4 milliárd dolláros veszteséget jelentett, miután a Bitcoin árfolyama 60 000 dollár alá esett

Megbillent a Bitcoin-vállalati narratíva: a korábban zászlóshajónak számító Strategy és a BitMine is tízmilliárdos veszteségeket könyvel el. Az intézményi kriptobefektetések nyereségígérete úgy tűnik, pillanatok alatt elolvadt.
2026. 02. 06. 19:00
Megosztás:

A szólás- és sajtószabadsággal foglalkozó podcastsorozatot indít az NMHH

A médiarendszer kétosztatúságának gyökerei a rendszerváltozásig nyúlnak vissza, és a közéletben ma már mindenki a saját közönségéhez beszél - ez is elhangzott a Nemzeti Média- és Hírközlési Hatóság (NMHH) új podcastsorozatában, amely a szólás- és sajtószabadság átfogó, sokoldalú megközelítését mutatja be közérthető formában. Az első adásban Koltay András, az NMHH és a médiatanács elnöke Lampé Ágnes újságíróval és Exterde Tibor műsorvezetővel vitatja meg a szólásszabadság örök és éppen aktuális kérdéseit - közölte a hatóság kommunikációs igazgatósága pénteken az MTI-vel.
2026. 02. 06. 18:30
Megosztás:

Naponta ezer kátyút javítanak a fővárosban

Naponta ezer kátyút javítanak meg, és még tovább emelik a kátyúzási kapacitást; hétvégén és éjszaka is dolgoznak a szakemberek, mivel az időjárás végre lehetővé teszi a tartós megoldást jelentő technológiát - közölte a főpolgármester pénteken a Facebook-oldalán.
2026. 02. 06. 17:30
Megosztás:

Itt az új transzferár-dokumentációs rendelet!

Több ponton módosította a kapcsolt vállalkozások közötti ügyletek dokumentálására vonatkozó hazai szabályokat a tavaly decemberben kihirdetett transzferár-nyilvántartásról és a transzferár-adatszolgáltatásról szóló új rendelet. A jogalkotói cél az adminisztratív terhek csökkentése és az ellenőrizhetőség javítása, ugyanakkor az ICT Business Advisory Zrt. vezető adótanácsadója figyelmeztet, hogy a szabályozás számos területen szigorúbb, részletesebb indoklást vár el a vállalkozásoktól.
2026. 02. 06. 17:00
Megosztás:

Félelem a Bitcoin bányász-eladási hullámtól - A MARA 1318 BTC-t mozgatott

A Marathon Digital 10 óra alatt mozgatott 1 318 BTC-t: zuhan a Bitcoin árfolyama, a bányászok pedig mozogni kezdtek: a Marathon Digital (MARA) 86,9 millió dollárnyi BTC-t utalt át – a piaci szereplők szerint ez újabb eladási nyomás előjele lehet. A bányászok nehéz időszakon mennek keresztül, és a részvénypiac is büntet.
2026. 02. 06. 16:30
Megosztás:

Így repülnek ki súlyos milliók az ablakon egy rossz építési terv miatt

Az építkezések költségtúllépései és csúszásai nem a kivitelezésnél, hanem már a tervezőasztalon kezdődnek – állítja Bogdán Attila, a Platánplán Mérnöki Iroda ügyvezetője. A faipari mérnök szerint a magyar gyakorlatban gyakori tévhit, hogy a terv csak engedélyezési papírmunka, holott valójában a beruházás végső ára már az első döntéseknél eldől. A hiányos mérnöki kontroll, a késői módosítások és a gyenge kommunikáció milliós többletköltségeket okozhatnak.
2026. 02. 06. 16:00
Megosztás:

Öt hónapja csökkenésben a FAO élelmiszerár-indexe

Az ENSZ Élelmezésügyi és Mezőgazdasági Szervezete (FAO) pénteken kiadta legfrissebb jelentését az élelmiszer-alapanyagok világpiaci mutatójáról, amely szerint januárban ötödik hónapja csökkentek az élelmiszerárak, elsősorban a tejtermékek, a cukor és a húsfélék nemzetközi jegyzéseinek mérséklődése miatt.
2026. 02. 06. 15:30
Megosztás:

A piacépítés a legfontosabb a bormarketingért felelős kormánybiztos szerint

A bormarketingért felelős kormánybiztos szerint minden erőforrással piacot kell építeni a magyar bornak - közölte a Magyar Bormarketing Ügynökség pénteken az MTI-vel.
2026. 02. 06. 15:00
Megosztás:

Több mint hétszázzal több ügyet zártak le a békéltető testületek

Az országban működő nyolc regionális békéltető testület 2025-ben összesen 11 574 fogyasztói jogvitát zárt le sikeresen, ez 704 üggyel több, mint az előző évben, a hat százalékos növekedés jól mutatja a fogyasztói jogvitákban eljáró alternatív vitarendezési fórum iránti növekvő bizalmat és igényt - közölte a Magyar Kereskedelmi és Iparkamara (MKIK) pénteken az MTI-vel.
2026. 02. 06. 14:00
Megosztás:

Országos közúti ellenőrzést tart a rendőrség

A rendőrség február 9. és 15. között Magyarország teljes területén közúti ellenőrzést tart - közölte az Országos Rendőr-főkapitányság Kommunikációs Szolgálata pénteken a police.hu oldalon.
2026. 02. 06. 13:30
Megosztás:

Stabilcoinok özöne az eladási hullám közepette – 98 milliárd dolláros beáramlás jelzi a piac ébredését?

Miközben a kriptopiac gyenge lábakon áll és az árfolyamok esnek, a stabilcoinok beáramlása váratlanul felfutott – ez akár a fordulat jele is lehet? Nézzük, mit mutatnak az adatok.
2026. 02. 06. 13:00
Megosztás:

Magyarország ipari termelési adatok - elemzés

A tavaly decemberi ipari termelési adatok érkeztek ma reggel. A KSH közleménye szerint 2025 decemberében az ipari termelés volumene munkanaphatástól megtisztítva 1 százalékkal maradt el a 2024 decemberitől, ami némileg kedvezőbb lett az általunk várt 1,5 százalékos visszaeséstől.
2026. 02. 06. 12:30
Megosztás:

Magyar sztárfocisták külföldi álomfizetései a professzionális vagyonkezelő szemével

Tóth Alex – januári átigazolásával az angliai Bournemouth csapatába – minden idők legdrágább NB I-ből távozó játékosa lett, 12 millió euróval (+3 millió euró bónusz lehetőséggel) gazdagítva előző klubcsapatát, a Ferencvárost.
2026. 02. 06. 12:00
Megosztás:

Minden eddiginél nagyobb lépés történt a MÁV-flotta megújítása felé

Plusz 50 ezer vasúti ülőhely: mintegy 100 távolsági és elővárosi motorvonat, csaknem 90 új InterCity-kocsi - erről szól a most megjelent kormányhatározat, amivel újabb, minden eddiginél nagyobb lépés történt a MÁV-flotta megújítása felé - tette közzé pénteki Facebook bejegyzésében Hegyi Zsolt, a MÁV-csoport vezérigazgatója.
2026. 02. 06. 11:30
Megosztás:

Hiába nagyon vonzó, kezd kifulladni a munkáshitel

Decemberre újabb mélypontra süllyedt a kamatmentes munkáshitel új szerződéseinek összege, miközben láthatóan csökken az érdeklődés a támogatott konstrukció iránt – hívja fel a figyelmet Barát Mihály, a BiztosDöntés.hu pénzügyi szakújságírója. A munkáshitel iránti keresleten az Otthon Start hitel megjelenése sem segített, így az idén stabilan havi 10 milliárd forint alatt maradhat az új kihelyezések havi összege.
2026. 02. 06. 11:00
Megosztás: