Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen


Magyar Péter: arra számítunk, hogy a legfőbb ügyész rövidesen le fog mondani

Arra számít a kormány, hogy a legfőbb ügyésznek rövidesen le kell mondania, és le is fog mondani - mondta hétfőn sajtótájékoztatón Magyar Péter miniszterelnök, Budapesten.
2026. 06. 23. 05:00
Megosztás:

Minél kisebb, annál drágább: ennyivel kerül többe a minilakások négyzetmétere

A minilakások vidéken is egyre népszerűbbek: a legfeljebb 25 négyzetméteres lakások a vármegyeszékhelyeken - köztük Debrecenben, Pécsett, Kecskeméten és Szombathelyen - is megjelentek a kínálatban, nagyjából 20 millió forintos belépővel. Négyzetméteráruk jellemzően 20–30 százalékkal alacsonyabb a budapesti szintnél. A fővárosban átlagosan 30 millió forintért, négyzetméterenként pedig a használtlakás-átlagnál mintegy 12 százalékkal drágábban cserélnek gazdát ezek az apró lakások - derül ki a Duna House friss ingatlanpiaci elemzéséből.
2026. 06. 23. 04:30
Megosztás:

A bértranszparencia nem vár: Miért kell a munkáltatóknak már most lépniük?

A 2023-ban elfogadott uniós bértranszparencia-irányelv hazai átültetésére a június 7-én lejárt határidő ellenére ugyan még nem került sor, és törvénytervezet sem ismert jelenleg, ez azonban nem jelenti azt, hogy a munkáltatók számára már most ne lennének teendőik. Sőt, a szabályozás gyakorlati hatásai több szervezetnél már most olyan HR- és munkajogi kérdéseket vetnek fel, amelyek kezelése hosszabb előkészítést igényelhet – derül ki a Taylor Wessing nemzetközi ügyvédi iroda elemzéséből.
2026. 06. 23. 04:00
Megosztás:

A britek csaknem kétharmada helyesli Keir Starmer miniszterelnök távozását

A hétfőn ismertetett legfrissebb felmérés szerint a britek csaknem kétharmada helyesli Keir Starmer munkáspárti miniszterelnök távozását.
2026. 06. 23. 03:00
Megosztás:

Az Alkotmány így rendelkezik a nyugdíjról

A hatályos magyar jogrendben a nyugdíjakra vonatkozó alapvető rendelkezéseket elsősorban Magyarország Alaptörvényének XIX. cikke tartalmazza. Fontos megjegyezni, hogy Magyarországon a korábbi „Alkotmány” helyett jelenleg a Magyarország Alaptörvénye elnevezésű jogszabály van hatályban.
2026. 06. 23. 02:00
Megosztás:

Ön havi 87.000 Ft-ot félre tud tenni? Ha nem, akkor bajban van

A magyar felnőtt lakosság 81 százaléka rendelkezik megtakarítással, a megtakarítók 93 százaléka pedig havi rendszerességgel is félre tud tenni – derül ki az MBH Befektetési Bank 2026-os reprezentatív kutatásából. A megtakarítással rendelkező háztartások átlagosan havi 87 ezer forintot tudnak félretenni.
2026. 06. 23. 01:00
Megosztás:

Átszervezik a műtétek rendjét az Országos Onkológiai Intézetben a klímarendszer meghibásodása miatt

Átmenetileg módosítani kellett az Országos Onkológiai Intézet műtéti rendjét a 3-as épület műtői légtechnikai és klimatizációs rendszerének meghibásodása, valamint a tartós hőhullám miatt - közölte az intézet hétfő este a Facebook-oldalán.
2026. 06. 23. 00:05
Megosztás:

Indul a szélerőmű-kapacitások országos felmérése

Elérhető a szélerőmű-kapacitások létesítésére, bővítésére irányuló piaci elképzeléseket felmérő online kérdőív, amelynek kitöltésével az érintettek július 8-ig ismertethetik tervezett projektjeik részleteit a Magyar Energetikai és Közmű-szabályozási Hivatallal (MEKH).
2026. 06. 22. 23:00
Megosztás:

Egynapos bezárással tiltakoznak a kisbenzinkutak

Egynapos figyelmeztető bezárásra szólítja fel a kisbenzinkutakat a Független Benzinkutak Szövetsége Egyesület (FBSZ), mert a Tisza-kormány nem hajtja végre a korábbi árrendszer okozta károk enyhítésére indított támogatási programot - közölte az FBSZ hétfőn az MTI-vel.
2026. 06. 22. 22:30
Megosztás:

A Strategy 520 Bitcoint vett, miközben 1,4 milliárd dollárra növelte készpénztartalékát

A Strategy újabb 520 Bitcoinnal bővítette vállalati kriptovagyonát, a társaság legfrissebb pénzügyi lépéseinek középpontjában azonban ezúttal nem kizárólag a BTC-felhalmozás állt. A vállalat 300 millió dollárral növelte készpénztartalékát, miközben a befektetők egyre nagyobb figyelmet fordítanak az STRC értékpapírok támogatására és a jövőbeli tőkeallokációra.
2026. 06. 22. 22:02
Megosztás:

Eltörli a stabilcoin-birtoklási korlátot a Bank of England

Jelentősen enyhített a brit stabilcoin-szabályokon a Bank of England. A jegybank végleges szakpolitikai kerete már nem korlátozza, hogy egy magánszemély mennyi fontalapú stabilcoint (angolul: stablecoin) tarthat, miközben az egyes tokenek teljes kibocsátását kezdetben 40 milliárd fontban maximálja. A tartalékkezelési előírásokat szintén lazították, miután a kriptoipar arra figyelmeztetett, hogy a korábbi tervek ellehetetleníthetik a sterlinghez kötött digitális pénzek széles körű elterjedését.
2026. 06. 22. 20:30
Megosztás:

Pontosabban céloz a NAV: kevesebb vizsgálat, nagyobb adómegállapítások

Kevesebb vizsgálatot folytatott le 2025-ben a Nemzeti Adó- és Vámhivatal (NAV), mint egy évvel korábban, az utólagos adóellenőrzések eredményessége azonban határozottan javult. A napokban megjelent éves összefoglaló alapján az adóhatóság egyre pontosabban választja ki a kockázatos ügyeket, miközben továbbra is az áfa, a kiemelt adózói kör, a transzferárak, az építőipar és az e-kereskedelem tartozik a legfontosabb ellenőrzési területek közé – hívja fel a figyelmet az EY.
2026. 06. 22. 19:30
Megosztás:

Tokaji bort is a világ legjobbjai közé választottak Londonban

Bekerült a mindössze ötven Best in Show bor közé az Oremus Pincészet 6 puttonyos 2016-os tokaji aszúja a világ egyik legtekintélyesebb borversenyeként számon tartott Decanter World Wine Awards (DWWA) idei kiadásán.
2026. 06. 22. 19:00
Megosztás:

Bitcoin árfolyam elemzés: kriptovaluta előrejelzés – fordulat vagy újabb esés jön?

A Bitcoin árfolyama a meredek júniusi visszaesés után 60 000 dollár közeléből próbál talpra állni, de a technikai kép továbbra is ellentmondásos. A MACD és a rövid távú momentum már javulást jelez, miközben a fontosabb mozgóátlagok, az Awesome Oscillator és a kialakult trendstruktúra még mindig az eladók fölényét mutatja. Az elemzés alapján jelenleg nem az agresszív vétel, hanem a tartás és a megerősítésre várás tűnik a legjobb stratégiának.
2026. 06. 22. 18:30
Megosztás:

Elkezdődtek a nyári Erzsébet-táborok

Elkezdődtek hétfőn a nyári Erzsébet-táborok, augusztus 28-ig több mint 40 ezren kapcsolódhatnak ki négy helyszínen - közölte a szervező Erzsébet a Kárpát-medencei Gyermekekért Alapítvány (Erzsébet alapítvány) az MTI-vel.
2026. 06. 22. 18:00
Megosztás:

Szlovéniában 40 százalékkal nőtt az illegális határátlépések száma az első öt hónapban

Szlovéniában az év első öt hónapjában 12 089 illegális határátlépést regisztráltak, ami 40 százalékos növekedés az előző év azonos időszakához képest - közölte hétfőn a szlovén rendőrség.
2026. 06. 22. 17:30
Megosztás:

Mennyi pénz van a magyaroknál?

A magyar felnőtt lakosság 81 százaléka rendelkezik megtakarítással, a megtakarítók 93 százaléka pedig havi rendszerességgel is félre tud tenni - derül ki az MBH Befektetési Bank reprezentatív kutatásából.
2026. 06. 22. 17:00
Megosztás:

Drágábbak a minilakások, de egyre népszerűbbek

Minél kisebb egy lakás, jellemzően annál magasabb négyzetméteráron kel el a magyarországi ingatlanpiacon, a rövid távú lakáskiadás szigorodó szabályozása azonban kezdi átrendezni a keresletet - derül ki a Duna House friss ingatlanpiaci elemzéséből.
2026. 06. 22. 16:30
Megosztás:

Véget vethet a CLARITY Act a kriptofejlesztők büntetőjogi üldözésének

Cynthia Lummis amerikai szenátor szerint egy szoftverfejlesztőnek nem kellene ügyvédeket alkalmaznia ahhoz, hogy eldöntse, legális-e az általa megírt programkód. A politikus úgy véli, a digitális eszközök piacát szabályozó CLARITY Act egyértelmű jogi védelmet teremthet a nem letétkezelő kriptoszoftverek, blokklánccsomópontok és decentralizált infrastruktúrák fejlesztői számára.
2026. 06. 22. 16:00
Megosztás:

Az aratás végéig fokozott figyelemre inti a gépjárművezetőket az agrárkamara

Országszerte elkezdődött az aratás, a gépjárművezetőknek fokozottan figyelniük kell az utakon a mezőgazdasági munkagépekre és vontatókra – közölte a Nemzeti Agrárgazdasági Kamara (NAK) hétőfn az MTI-vel.
2026. 06. 22. 15:30
Megosztás: