Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Emelkedik a Tesco dolgozók bére

Megállapodott a szakszervezetekkel a Tesco az idei bérekről, az áruházlánc átlagosan 7,2 százalékkal emeli a munkatársak bérét - tájékoztatott a vállalat, valamint a Kereskedelmi Alkalmazottak Szakszervezete (KASZ) és az Egyenlő.hu - a modern szakszervezet közös közleményben pénteken.
2026. 01. 23. 21:00
Megosztás:

A VIBE Budapest kísérlet az étterem és az éjszakai szórakozás határán

A vendéglátásban ritkán jelenik meg olyan modell, amely tudatosan a megszokott kategóriák határán mozog. A VIBE Budapest egy olyan kísérletként indult, amely egy szervezeti és működési keretben kezeli az éttermi szolgáltatást és az esti szórakozást. Az elmúlt időszak tapasztalatai alapján ma már jól látható, milyen üzleti és működési tanulságokkal jár egy ilyen típusú megközelítés a hazai piacon.
2026. 01. 23. 20:31
Megosztás:

Valami zavaros az étolaj piacán, a GVH vizsgálatot indított

Nagyobb mértékben drágult az étolaj Magyarországon, mint a környező országokban, ezért a Gazdasági Versenyhivatal (GVH) gyorsított ágazati vizsgálatot indított. A GVH gyanúja szerint ágazati piaci jellemzők vezethettek ahhoz, hogy Magyarországon magasabb árszint alakult ki. A nemzeti versenyhatóság szorosan együttműködve a Magyar Nemzeti Bankkal (MNB) továbbra is minden rendelkezésére álló eszközével azon dolgozik, hogy megvédje a magyar fogyasztókat a versenyhiányból fakadó túlzó áremelésektől és a jogsértő gyakorlatoktól.
2026. 01. 23. 20:00
Megosztás:

Három új szervezetnek gyűjt adományt a MOHU

A MOHU Mosolyra váltó programjában a fogyasztók fél éven át három új szervezetet támogathatnak: a Peter Cerny Alapítványt, a Gyermekétkeztetési Alapítványt és az SOS Gyermekfalvakat.
2026. 01. 23. 19:00
Megosztás:

Megugrott az érdeklődés az amerikai XRP és Solana ETF-ek iránt – de hol vannak a hivatalos megerősítések?

Feltűnő tőkeáramlás XRP és Solana ETF-ekbe. 2026 január 22-én jelentős, de egyelőre meg nem erősített tőkeáramlást jelentettek az Egyesült Államokban elindított XRP és Solana spot ETF-ek esetében.
2026. 01. 23. 18:30
Megosztás:

Tartalékból élni: a fiataloknál nagy a szórás, meddig elég a félretett pénz

A fiatalok átlagos nettó jövedelme havonta 252 ezer forint és 55 százalékuk rendelkezik valamilyen megtakarítással a K&H ifjúsági indexe szerint. A megtakarítók körében ugyanakkor a „meddig elég a tartalék” kérdésnél már nagy a szórás: 40 százalékuk legfeljebb egy hónapra, 26 százalékuk pedig maximum három hónapra elegendő pufferrel rendelkezik, míg 34 százalékuk legalább 6 hónapig meg tudna élni a felhalmozott összegből, ha nem lenne semmilyen bevétele.
2026. 01. 23. 17:30
Megosztás:

A magyar kriptós vita közepén jött egy új nemzetközi whitepaper

A Bitget közzétette legújabb kutatási whitepaperét, amely az úgynevezett Univerzális Tőzsde (Universal Exchange – UEX) koncepcióján keresztül a globális kereskedés következő fejlődési szakaszát vázolja fel – közölte a vállalat.
2026. 01. 23. 16:00
Megosztás:

Ráfizetés is lehet a korlátlan mobilnet

Egyre többen használnak korlátlan mobilszolgáltatásokat kínáló tarifacsomagot, de az érintett fogyasztók mintegy felének valamilyen fix adatkeretes előfizetés is elég lenne - állapította meg a Nemzeti Média- és Hírközlési Hatóság (NMHH) friss tanulmánya. A 2025-ben, több mint 1000 fő bevonásával készült online kutatás szerint a lakossági számlás mobilelőfizetők mintegy fele korlátlan belföldi hanghívást, egyharmaduk pedig korlátlan mobilnetet használ, sokan azonban nem mérik fel, valóban szükségük van-e limit nélküli adatcsomagra - közölte a hatóság kommunikációs igazgatósága pénteken az MTI-vel.
2026. 01. 23. 15:00
Megosztás:

Munkaerő-kölcsönzés 2026-ban: ami megmenti a céget, az el is buktathatja

A 2026 elején is alacsony, közel 4,4 százalékos munkanélküliségi ráta mellett számos ágazatban – különösen az építőiparban és az élelmiszer-feldolgozó szektorban – továbbra is súlyos munkaerőhiány tapasztalható. Egyre több vállalat fordul munkaerő-kölcsönzéshez és külföldi munkavállalók foglalkoztatásához, ám ezek a megoldások csak akkor jelentenek valódi segítséget, ha a cégek nem gyors tűzoltásként, hanem tudatosan felépített, adózásilag- és jogilag rendezett modellként alkalmazzák őket – figyelmeztet a Niveus.
2026. 01. 23. 14:30
Megosztás:

Ennyi volt a bruttó átlagkereset novemberben

2025 novemberében a teljes munkaidőben alkalmazásban állók bruttó átlagkeresete 756 400, a nettó átlagkereset 525 900 forint volt. A bruttó átlagkereset 8,9, a nettó átlagkereset 10,2, a reálkereset pedig 6,2 százalékkal múlta felül az egy évvel korábbit - jelentette pénteken a Központi Statisztikai Hivatal (KSH).
2026. 01. 23. 14:00
Megosztás:

Adventi ellenőrzések: tízből egy vállalkozás hibázott

A Nemzeti Adó- és Vámhivatal (NAV) revizorai tavaly decemberben mintegy 6 ezer kiemelt ellenőrzést végeztek az adventi vásárokon, piacokon, fenyőfaárusoknál, nagyobb bevásárlóközpontokban, illetve vendéglátóhelyeken. A vizsgálatok során minden tízediknél találtak valamilyen szabálytalanságot - jelentette be pénteken a Nemzeti Adó- és Vámhivatal (NAV).
2026. 01. 23. 13:30
Megosztás:

A kormány által biztosított tüzelő kiosztását az önkormányzatok végzik

A kormány által biztosított tüzelő kiosztását az önkormányzatok végzik - közölte az operatív törzs péntek délelőtt az MTI-vel.
2026. 01. 23. 13:00
Megosztás:

Csalók élnek vissza a Magyar Vöröskereszt nevével

A Magyar Vöröskereszt úgy értesült, hogy ismeretlen személyek jogtalanul használják a szervezet nevét. A csalók telefonon keresztül kérnek pénzbeli adományt a hívott féltől, miközben a Magyar Vöröskeresztre hivatkoznak - közölte a humanitárius szervezet pénteken az MTI-vel.
2026. 01. 23. 12:30
Megosztás:

Csökken a foglalkoztatás, fogy a népesség

2025. decemberben 4 millió 624 ezer fő volt a foglalkoztatottak száma a 15-74 év közötti munkaképes korú népesség körében, ami 2021 május óta nem látott alacsony érték. Egy hónap alatt 14 ezer fővel, míg egy év alatt 55 ezerrel csökkent a foglalkoztattak száma. A háromhavi adatok alapján sem javult a kép: 2025. október-december között a foglalkoztatottak átlagos létszáma a 15–74 évesek körében 4 millió 642 ezer fő volt, ami 2021 közepén látott alacsony szint.
2026. 01. 23. 12:00
Megosztás:

Az intelligens szivattyúvezérlés előnyei: miért válasszon inverteres rendszert?

Érezte már valaha, hogy a vízellátás nagyban befolyásolja a mindennapjait? Napjaink modern otthonaiban a vízellátási rendszerek már sokkal fejlettebb megoldásokkal működhetnek, mint régen.
2026. 01. 23. 11:30
Megosztás:

A kiszámíthatatlanságot tartják a gazdaság egyik fő problémájának a kkv-k

A kkv szektor két éve tartós alkalmazkodási pályára állt, a kedvezőtlen makrofeltételek közepette a működőképesség fenntartására rendezkedtek be a vállalkozások, amelyek szerint a kiszámíthatatlanság vált az egyik legfőbb problémává saját vállalkozásuk üzletmenetét illetően – derül ki a VOSZ-tag kkv-k üzleti hangulatát, beruházási hajlandóságát és pénzügyi helyzetét negyedévente mérő VOSZ Barométer friss kutatásából.
2026. 01. 23. 11:00
Megosztás:

Mire számíthatnak péntek a befektetők?

A japán jegybank pénteken megemelte növekedési előrejelzését, és változatlanul fenntartotta szigorú hangvételű inflációs prognózisait, miközben nem változtatott az irányadó kamatokon.
2026. 01. 23. 10:30
Megosztás:

Megnyugodott az európai kötvénypiac Trump beszédét követően

Donald Trump szerdai beszéde után nyugodt kereskedés zajlott az európai kötvénypiacokon, a kötvényhozamokban nem volt érdemi és egyértelmű elmozdulás.
2026. 01. 23. 10:00
Megosztás:

Tovább emelkedtek az amerikai piacok az enyhülő feszültségek hatására

Trump enyhülő retorikáját az amerikai befektetők is értékelték: zsinórban második napja emelkedtek a tengerentúli piacok, így az S&P 500 és Dow fél százalékkal, a Nasdaq pedig 0,9%-kal zárt feljebb.
2026. 01. 23. 09:30
Megosztás:

Emelkedtek az európai részvények Trump visszakozásának hírére, kiugró hangulatban volt a KKE-régió

Nagyot emelkedtek az európai részvények, miután Trump visszakozott Grönland ügyében, elutasítva a katonai fellépést és a vámok bevezetését az európai országokra. Ez azután történt, hogy Trump egyeztetett Mark Rutte NATO-főtitkárral és elmondása szerint kezd a megegyezés körvonalazódni, amely egy korábbi, 1951-es egyezményre épülne Dánia és az Egyesült Államok között. A Stoxx 600 egy százalékkal ugrott feljebb, ezen belül a német DAX 1,2, a francia CAC 40 pedig egy százalékkal emelkedett.
2026. 01. 23. 09:00
Megosztás: