Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Melyik autó most a menő? 920 ezer használt autó cserélt gazdát 2025-ben

Az előzetes adatok szerint a hazai használtautó-piacon minden eddiginél több, 920 200 személygépkocsi cserélt gazdát 2024-ben. Ez az érték 1,5 százalékkal haladta meg az egy évvel korábbi rekordot: 2024-ben 906 900 volt a belföldi átírások száma. Ezzel a használt személyautók hazai piacának forgalma egy évtized alatt közel 70 százalékkal emelkedett.
2026. 01. 20. 04:00
Megosztás:

Solana és a Base robbantotta fel a stablecoin-piacot: 3,82 milliárd dolláros növekedés egy hét alatt

Új lendületet kapott a kriptovaluta-piac: mindössze néhány nap leforgása alatt több milliárd dollárral nőtt a stablecoinok összértéke. A háttérben két blokklánc, a Solana és a Base áll, miközben az intézményi befektetők aktivitása és a likviditási mozgások is új trendeket vetítenek előre a kriptopiacon.
2026. 01. 20. 03:00
Megosztás:

Horvát kormányfő: ésszerű megoldás kell a Grönland körüli vitában

Ésszerű megoldást kell találni Washington és az Európai Unió (EU) között a Grönland körül kialakult vitában, és nem szabad ott feszültséget kelteni, ahol arra nincs szükség - jelentette ki hétfőn Andrej Plenkovic horvát miniszterelnök.
2026. 01. 20. 02:30
Megosztás:

Az IMF minimálisan javított idei globális növekedési előrejelzésén

A tavaly októberben vártnál 0,2 százalékponttal gyorsabban, 3,3 százalékkal nőhet az idén a globális gazdaság a Nemzetközi Valutaalap (IMF) hétfőn kiadott prognózisa szerint. A jövő évre vonatkozó 3,2 százalékos GDP-növekedési várakozás nem változott. Tavaly a globális gazdaság 3,3 százalékkal nőtt.
2026. 01. 20. 02:00
Megosztás:

Online petíció indult az élelmiszer-biztonság és magyar gazdák védelmében

Online petíció indult az élelmiszer-biztonság, a magyar föld és magyar gazdák védelmében - mondták hétfői sajtótájékoztatójukon Budapesten a Nemzeti Agrárgazdasági Kamara (NAK), valamint a Magyar Gazdakörök és Gazdaszövetkezetek Országos Szövetségének (Magosz) vezetői.
2026. 01. 20. 01:30
Megosztás:

MÁV-csoport: 13 százalékot meghaladó keresetnövekedés az idén

A kiegészítő bérfejlesztéssel a MÁV-csoport dolgozóinak alapbére 9,6 százalékkal nő, az összes emelést és juttatást beleszámolva 13 százalékkal kereshetnek többet az idén – közölte a társaság az MTI-vel azt követően, hogy hétfőn megállapodtak a munkavállalói érdekképviseletek, a cégcsoport, valamint az állam tulajdonosi jogait gyakorló Építési és Közlekedés Minisztérium (ÉKM) vezetői.
2026. 01. 20. 01:00
Megosztás:

Kezdődik az új Mercedes-Benz GLB sorozatgyártása a kecskeméti gyárban

A kecskeméti Mercedes-Benz gyárban megkezdődött az új elektromos GLB sorozatgyártása. A magyarországi üzem rugalmas európai MMA-gyártási hálózatban működik együtt a délnémet rastatti gyárral. Az új EQ technológiájú GLB (az EQB után) már a második teljesen elektromos Entry modell, amely a kecskeméti telephelyen készül – ezt követi majd az év folyamán a modern belső égésű motorral szerelt 48 V-os hibrid GLB. A modellnek mind a teljesen elektromos, mind a csúcstechnológiás hibrid hajtású változata ugyanazon a gyártósoron készül majd, rugalmas gyártásszervezéssel.
2026. 01. 20. 00:30
Megosztás:

Etiópia új gazdasági fejezete: állami Bitcoin-bányászat zöld energiával

Etiópia új irányt vesz a kriptovaluta-iparban: a kormány saját hatáskörben, állami szinten kíván belépni a Bitcoin-bányászat világába. A cél nem pusztán a profit – az ország zöld energiából teremtene digitális vagyont, miközben hosszú távú gazdasági és pénzügyi stratégiájának új alappillérét fekteti le.
2026. 01. 19. 23:30
Megosztás:

A világ dollármilliárdosainak vagyona nőtt tavaly

A világ dollármilliárdosainak vagyona 16 százalékkal nőtt tavaly, háromszor gyorsabban az elmúlt öt év átlagánál - derült ki az Oxfam jótékonysági szervezet hétfőn közzétett tanulmányából, amelyet a davosi Világgazdasági Fórum (WEF) előtt hoztak nyilvánoságra.
2026. 01. 19. 23:00
Megosztás:

A Bitcoin ralija összeomlott 97 000 dollárnál, ahogy a finanszírozási ráta megtorpant, a kisbefektetők kimaradtak – Miért a Digitap ($TAP) a legjobb kriptovaluta, amit ma érdemes megvenni

A Bitcoin ralija erős ellenállásba ütközött 97 000 dollárnál, és az elutasítás egyértelmű jele annak, hogy a vevők nem hajlandók ezen a szinten tovább vásárolni. Az árfolyam közel 97 900 dollárnál tetőzött, majd visszaesett 95 500 dollár környékére, így a kitörési próbálkozás visszahúzódássá alakult.
2026. 01. 19. 22:00
Megosztás:

Magyar fejlesztésű autósapp segít spórolni a kötelezőn

Megéri jól vezetni a Drivello-val – az UNION új okosappja díjazza a felelősséget, a felhasználók kedvezményt kaphatnak a kötelező biztosításuk díjából.
2026. 01. 19. 21:30
Megosztás:

Vegyesen változott hétfő estére a forint árfolyama

Vegyesen alakult a forint árfolyama a főbb devizákkal szemben hétfő estére a reggeli szintekhez képest a nemzetközi devizakereskedelemben.
2026. 01. 19. 21:00
Megosztás:

Jakub Stanislavot nevezte ki közép-kelet-európai szállodaüzletágának vezetőjévé a CBRE

Jakub Stanislavot nevezte ki a közép-kelet-európai szállodai üzletágának vezetőjévé 2026 januártól a világ legnagyobb kereskedelmi ingatlanszolgáltató és befektetési vállalata. A szakember továbbra is a csehországi tőkepiaci üzletágat vezeti, emellett pedig a vállalat szállodai befektetési tanácsadási platformját is irányítja Közép- és Kelet-Európában. A CBRE Magyarország esetében Csörget Balázzsal, a helyi hotel csapat vezetőjével és Antoine Fromental hotel befektetési elemzővel működik szorosan együtt.
2026. 01. 19. 20:30
Megosztás:

2,04 dolláros XRP vagy Digitap ($TAP)? Kriptós előértékesítési alfa 2026 januárjában

Az XRP-t visszautasították 2,40 dolláron, és most beragadt. Az árfolyam 2,04 dollár körül ingadozik egyértelmű irány nélkül. A kereskedők a grafikonokat figyelik. A forgalom elapadóban. Mindenki a következő lépésre vár. Csakhogy a várakozás pénzbe kerül. Miközben az XRP egy szűk sávban konszolidálódik, egy másik lehetőség egyre nagyobb lendületet vesz.
2026. 01. 19. 20:00
Megosztás:

Az EU-nak megvannak az eszközei az új amerikai vámok elkerülésére

Az EU rendelkezik azokkal az eszközökkel, amelyekkel elrettentheti Donald Trump amerikai elnököt attól, hogy új vámokat vessen ki azokra az országokra, amelyek ellenzik Grönland amerikai annektálását – jelentette ki hétfőn Stéphane Séjourné iparpolitikáért felelős uniós biztos.
2026. 01. 19. 19:30
Megosztás:

A Mol szándéknyilatkozatot írt alá a szerb NIS többségi tulajdonának megvásárlásáról

A Mol-csoport kötelező erejű szándéknyilatkozatot írt alá a Gazprom Neft társasággal a szerb Naftna Industrija Srbije (NIS) vállalatban fennálló 56,15 százaléknyi részesedésük megvásárlásáról, a tranzakció megvalósulásával a Mol jelentős részvényesi felelősséget és irányítási jogot vállalhat a Szerbia egyetlen olajfinomítóját üzemeltető társaságban, amellyel tovább erősítheti jelenlétét a közép- és délkelet-európai energiapiacon - közölte az olajtársaság a tőzsde honlapján hétfőn délután.
2026. 01. 19. 19:00
Megosztás:

Hiába startol el nemsokára az új lakást vásárlókat segítő jogszabály, a bankok még az öltözőben vannak

A március 1-től élesedő jogszabályi változás elvben lehetővé tenné, hogy a vevők a „társasházi építményi jog” bejegyzésével már az építkezés korai szakaszában hitelhez jussanak. A gyakorlati megvalósítás azonban még várat magára. A money.hu piaci körképe szerint a hazai nagybankok még nem készültek fel az új jogintézmény finanszírozására: a háttérben javában folynak az egyeztetések a Bankszövetséggel.
2026. 01. 19. 18:30
Megosztás:

Az MBH Jelzálogbank bocsátotta ki a legtöbb jelzáloglevelet a hazai piacon 2025-ben

Az MBH Jelzálogbank érte el a legnagyobb jelzáloglevél-kibocsátási volument a hazai piacon 2025-ben: összesen több mint 55 milliárd forint értékben hozott forgalomba jelzáloglevelet, és az egyedüli intézmény volt Magyarországon, amely dedikáltan lakossági befektetőknek szánt jelzálogleveleket is értékesített. Mindezek mellett tavaly sikerrel zárult az MBH Csoporthoz tartozó hitelintézet első nemzetközi kibocsátása is. A kereslet alakulása visszaigazolja az MBH Jelzálogbank azon törekvését, hogy a hazai és a külföldi piacokon is aktív kibocsátóként legyen jelen, valamint egyértelműen jelzi a jelzáloglevelek iránti tartós befektetői bizalmat és az értékpapír finanszírozásban betöltött stabil szerepét.
2026. 01. 19. 18:00
Megosztás:

Már elérhető az szja-bevallás webes kitöltő programja

A 2025-re vonatkozó bevallások tervezetét idén is elkészíti a NAV, de akik maguk töltenék ki a dokumentumot, már hozzáférhetnek az szja-bevallás webes kitöltő programjához - hívta fel a figyelmet hétfői közleményében Nemzeti Adó- és Vámhivatal (NAV).
2026. 01. 19. 17:30
Megosztás:

A HungaroControl 2025-ben több mint 1,4 millió járat biztonságos közlekedéséért felelt

Rekordmennyiségű repülőgépet kezelt tavaly a HungaroControl: a vállalat légiforgalmi irányítói a magyar és a koszovói légtérben összesen több mint 1,4 millió légi jármű biztonságos közlekedéséért feleltek, ami 8,37 százalékos emelkedés 2024-hez képest - közölte a HungaroControl Zrt. hétfőn az MTI-vel.
2026. 01. 19. 17:00
Megosztás: