Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Az automatizált rendszerek lehetőségei a nyelviskolák számára

A nyelvoktatás kihívásait már jól ismerjük: az adminisztráció, az órák megszervezése és a tanulók menedzselése sokszor embert próbáló feladat.
2026. 01. 18. 13:00
Megosztás:

Több mint 2900 milliárd forint jutott el a gazdákhoz az új agrártámogatási ciklusban

A magyar agrárium tavaly is bizonyította a kitartását: a gazdálkodók minden nehézség ellenére folyamatosan helytálltak, és ehhez a kiszámítható, jól tervezett agrártámogatási háttér is hozzájárult. Ennek eredményeként a 2023-tól induló új agártámogatási ciklusban a beruházási típusú támogatásokra rendelkezésre álló 3150 milliárd forintos keretösszegből már csaknem 2900 milliárd forintnyi támogatást ítéltünk meg, 102 ezer támogatói okirattal - jelentette be Nagy István agrárminiszter vasárnap közösségi oldalán.
2026. 01. 18. 12:00
Megosztás:

Az eddigi leggyengébb évét hozta a babaváró hitel

Ugyan 2025-ben sorban dőltek a rekordok a lakossági hitelek piacán, a babaváró hitel szempontjából igen gyengére sikerült a tavalyi év: az első tizenegy hónap mindössze bő 210 milliárd forintnyi új szerződést hozott, ami 8,5 százalékos visszaesést tükröz az egy évvel korábbi volumenhez képest – hívja fel a figyelmet Barát Mihály, a BiztosDöntés.hu pénzügyi szakújságírója. Ezzel együtt a támogatott hitel még mindig 13 százalékát adja az összes fogyasztásihitel-szerződésnek, és a teljes lakossági hitelportfólión belül is 18 százalék körüli a részesedése.
2026. 01. 18. 11:00
Megosztás:

Megkezdte a termelést a szerbiai kőolaj-finomító

Közel két hónapos szünetet követően vasárnap újrakezdte a termelést a pancsovai kőolaj-finomító, a benzinkutakra január 27-én kezdődhet meg a szállítás - közölte Dubravka Djedovic Handanovic szerb energiaügyi miniszter vasárnap Instagram-oldalán.
2026. 01. 18. 10:00
Megosztás:

Növekvő forgalomban emelkedett a BUX a héten

Növekvő forgalom mellett emelkedett a Budapesti Értéktőzsde (BÉT) részvényindexe a héten, pénteken a BUX 122 311,20 ponton, történelmi csúcson zárt, 4,98 százalékkal magasabban, mint egy héttel korábban.
2026. 01. 18. 09:00
Megosztás:

Brit miniszterelnök: Helytelen, hogy Washington NATO-szövetségeseket fenyeget vámokkal

Keir Starmer brit miniszterelnök szerint teljességgel helytelen, hogy Washington büntetővámokkal fenyegeti a Grönland hovatartozásával kapcsolatos amerikai-dán viszály ügyében Dánia mellett felsorakozó NATO-szövetségeseket.
2026. 01. 18. 07:00
Megosztás:

Vulcan Shield Global: megkezdődött a toborzás Békéscsabára, csak magyar jelöltekkel beszéltek

Megkezdte a toborzást a szingapúri Vulcan Shield Global (VSG) új békéscsabai székhelyére, eddig csak magyar jelöltekkel beszélgettek - közölte a vállalat az MTI-vel pénteken.
2026. 01. 18. 05:00
Megosztás:

A lakásárak sprintelnek, a bérek kocognak: egyre nagyobb a szakadék

Az Eurostat friss adatai szerint 2015 óta az Európai Unión belül Magyarországon nőttek a legnagyobb mértékben a lakásárak. Bár ebben az időszakban a hazai átlagkeresetek is jelentősen emelkedtek, a bérnövekedés nem tudta tartani a lakásárak diktálta ütemet. Míg 2013 körül egyhavi nettó átlagbérből akár több mint 1 négyzetméter használt lakás is megvásárolható volt, addig 2025-ben ez jellemzően 0,7–0,9 négyzetméterre, új lakásoknál pedig 0,33–0,39-re csökkent a korábbi 0,50-ről. Egy 70 négyzetméteres használt lakás megvásárlásához 2013-ban még 5,6 évnyi, 2025-ben viszont már 6,4–8 évnyi nettó átlagkeresetre volt szükség, új lakásnál pedig akár 15–18 évre. Összességében a 2008-as válság után átmenetileg javult a megfizethetőség, de a 2010-es évek második felétől a lakhatás megfizethetősége ismét romlani kezdett – írja közleményében a Bank360.
2026. 01. 18. 04:00
Megosztás:

Megerősítette Dánia lehetséges legjobb osztályzatát a Moodys

Megerősítette Dánia lehetséges legjobb, "Aaa" szintű besorolásait a Moody's Ratings. A nemzetközi hitelminősítő a péntek éjjel Londonban bejelentett döntés indoklásában kiemelte, hogy az Egyesült Államokkal Grönland ügyében kialakult viszály diplomáciai megoldását valószínűsíti, és nem számol Dánia nemzetbiztonsági kockázatainak jelentős növekedésével.
2026. 01. 18. 03:00
Megosztás:

Jön a kötelező jogosítványcsere Magyarországon!

Az Európai Unió döntése értelmében 2033-ig valamennyi tagállamban kötelezően át kell térni az új típusú vezetői engedélyekre. De pontosan kiket érint a csere, és milyen határidőkkel kell számolni?
2026. 01. 18. 02:00
Megosztás:

Bejött amitől sokan féltek: itt a készpénzfizetési limit

Jelentős mérföldkőhöz érkezett az Európai Unió a pénzmosás visszaszorításában: elfogadták a 10 000 eurós készpénzfizetési felső határt, azt követően, hogy már tavaly decemberben létrehozták az uniós pénzügyi rendszer tisztaságát felügyelő központi hatóságot, az AMLA-t.
2026. 01. 18. 01:00
Megosztás:

Nagy meglepetés lett az 5-ös lottón!

A Szerencsejáték Zrt. tájékoztatása szerint a 3. héten megtartott ötös lottó és Joker számsorsoláson a következő számokat húzták ki:
2026. 01. 18. 00:05
Megosztás:

Nemzeti Bitcoin Tartalék az Egyesült Államokban? – Jogszabályi akadályok fékezik az ambiciózus tervet

Egyre több szó esik arról, hogy az Egyesült Államok hivatalos Bitcoin tartalékot hozna létre, ám a valóság sokkal bonyolultabb, mint a politikai ígéretek. Bár Donald Trump korábbi elnök már aláírt egy rendeletet a stratégiai BTC-tartalék létrehozásáról, a kivitelezés jogi útvesztőkben akadt el. Utánajártunk, mi áll a háttérben, és mi lehet a kriptoközösség jövője szempontjából ennek a jelentősége.
2026. 01. 17. 23:00
Megosztás:

Miért csak a kezdet a 240%-os emelkedés a január legjobb kripto előértékesítésében

A kriptovaluta előértékesítések során egy korai emelkedés gyakran a projekt végét jelzi.
2026. 01. 17. 22:00
Megosztás:

Húszéves a Mária Rádió

Húszéves a Mária Rádió, a 2026-os jubileumi év megnyitóját a budapesti Szent István-bazilikában tartották szombat este a rádió történetét bemutató album bemutatójával, kerekasztal-beszélgetéssel és szentmisével, amelyet Erdő Péter bíboros, esztergom-budapesti érsek mutatott be.
2026. 01. 17. 21:00
Megosztás:

A Digitap ($TAP) 4 millió dollárt gyűjtött banki forradalomhoz: Lehagyja a $2,10-on stagnáló DOT-ot, mint az év legjobb altcoinja

A Digitap ($TAP) 4,1 millió dollárt is meghaladó előértékesítési bevétele azt mutatja, hogy a piac valós időben választja a banki hasznosságot az infrastruktúrával szemben.
2026. 01. 17. 20:00
Megosztás:

2026 is az elsőlakás-vásárlók éve lesz

Az Otthon Start program alapjaiban fogja meghatározni 2025 második fele után az idei évet is, így 2026 is az elsőlakás-vásárlók éve lesz - mondta a Miniszterelnökség parlamenti és stratégiai államtitkára szombaton Budapesten, az Otthon Start Expón.
2026. 01. 17. 19:00
Megosztás:

A kormány támogatja a külterületi utak fejlesztését

A külterületek jó megközelíthetősége kulcskérdés a vidéki vállalkozások és a helyi közösségek számára, amelynek megteremtését az Agrárminisztérium is kiemelten támogatja. A "Külterületi utak fejlesztése" című felhívás keretében már több körben születtek támogatói döntések, így összesen már több mint 330 önkormányzat kérelme részesült pozitív támogatói döntésben, 30 milliárd forint összegben - jelentette ki a Facebook-oldalán szombaton az agrárminiszter.
2026. 01. 17. 17:05
Megosztás:

Szlovénia két katonatisztet küld Grönlandra

A szlovén kormány döntése alapján két katonatisztet küldenek Grönlandra egy dán vezetésű nemzetközi katonai gyakorlat előkészítésére és végrehajtására - közölte a szlovén védelmi minisztérium szombaton.
2026. 01. 17. 16:00
Megosztás:

Akadálymentes peront alakítanak ki a Keleti Pályaudvaron

Akadálymentes peront alakítanak ki a Keleti Pályaudvaron - közölte a MÁV-csoport vezérigazgatója a Facebook-oldalára szombaton feltöltött videójában.
2026. 01. 17. 15:00
Megosztás: