Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Megtérülés az első: így újítanak fel ma a magyar háztartások

A magyar háztartások fele jelenleg valamilyen lakás projektben gondolkodik: költözést, felújítást vagy korszerűsítést tervez. A lakás ma már nemcsak élettér, hanem pénzügyi döntések sorozata is - derül ki a MediaMarkt friss reprezentatív kutatásából.
2026. 02. 13. 11:30
Megosztás:

Megkezdődik a 1,5 milliárd forintos fejlesztés az orosházi kórházban

Csaknem 1,5 milliárd forintból fejlesztik az Orosházi Dr. László Elek Kórház és Rendelőintézetet, az első ütemben megkezdődik két fekvőbeteg-ellátó épületszárny megújítása - közölte az intézmény az MTI-vel.
2026. 02. 13. 11:00
Megosztás:

A növekvő kockázatkerülő hangulat következtében a kötvények felé fordultak a befektetők

Az amerikai részvénypiacok és a nemesfémek jelentős esése után a kötvények felé menekültek a befektetők. A kötvényhozamok az USA-ban érdemben estek, a 3 évesnél hosszabb lejáratokon 5-8 bázisponttal, a tízéves hozam pedig kéthavi mélypontra, 4,1%-ig csökkent. Az euróövezetben is estek a kötvényhozamok, de kisebb mértékben, 2-3 bázisponttal; a tízéves német hozam 2,8% alá süllyedt. A dollár ezúttal alig profitált a csökkenő kockázatvállalási hajlandóságból, az EUR/USD 0,1%-os eséssel 1,185 felé közelít.
2026. 02. 13. 10:30
Megosztás:

A vártnál gyengébben alakult az Egyesült Királyság növekedése a negyedik negyedévben

Vegyes képet mutattak az európai tőzsdék csütörtökön, a francia CAC 40 0,3%-kal növekedett, a DAX stagnált, az angol FTSE 100 viszont 0,7%-kal visszahúzta a pán-európai indexet, amely így 0,5%-os veszteségben zárta a napot. Az angol piac gyengeségéhez hozzájárulhatott, hogy a vártnál gyengébben teljesített az Egyesült Királyság a negyedik negyedévben, amikor az előző periódushoz képest mindössze 0,1%-kal emelkedett teljesítménye az elemzők által várt 0,2% helyett, így az éves növekedése 1,0% volt. A feldolgozóipar kedvező teljesítményét ellensúlyozta a továbbra is gyengélkedő építőipar, a szolgáltatások pedig két év óta először stagnáltak.
2026. 02. 13. 10:00
Megosztás:

Estek az amerikai indexek, Trump ismét környezetvédelmi szabályozásokat törölt el

Estek a tengerentúli indexek, mivel a befektetők fokozott mértékben adták el a technológiai részvényeket, és menekültek a közlekedési vállalatok papírjaiból az AI-al kapcsolatos híreket követően.
2026. 02. 13. 09:30
Megosztás:

Negyedmilliárd forintból fejlesztheti energiarendszereit Békéscsaba

Csaknem negyedmilliárd forint uniós támogatásból fejlesztheti energiamenedzsment rendszereit Békéscsaba - közölte az önkormányzat az MTI-vel.
2026. 02. 13. 09:00
Megosztás:

Gyengült a forint péntek reggel

Gyengült a forint a főbb devizákkal szemben péntek reggel az előző esti jegyzéséhez képest a nemzetközi devizakereskedelemben
2026. 02. 13. 08:30
Megosztás:

Fidelity: Van még érték az európai részvényekben?

Historikus összehasonlításban az európai részvények szinte minden értékeltségi mutató és szektor tekintetében jelentősnek számító diszkonttal kereskednek az amerikai részvényekhez képest. Bár ez a különbség részben a gyengébb növekedést, az alacsonyabb sajáttőke-arányos megtérülést és Európa ágazati összetételét tükrözi, a mértéke ma már nehezen indokolható pusztán a fundamentális adatokkal. Az európai vállalatok számos fontos ágazatban, többek között a pénzügyi, az energetikai, a közüzemi, az egészségügyi és az ipari szektorban hasonló eredményprofilokkal és hozamokkal rendelkeznek, mégis 20–40%-os diszkonttal kereskednek amerikai társaikhoz képest. Ennek köszönhető az a piac, melyen a pesszimizmus mélyen beágyazódott az árakba, a várakozások alacsonyak, és egyre nagyobb a szelektív emelkedés esélye.
2026. 02. 13. 08:00
Megosztás:

A magyar kormány gazdaság- és vállalkozóbarát

A magyar kormány gazdaság- és vállalkozóbarát, ennyi akciótervet és adócsökkentést senki sem hajtott végre eddig - mondta Nagy Márton nemzetgazdasági miniszter csütörtökön a Nógrád vármegyei Balassagyarmaton tartott gazdasági konferencián.
2026. 02. 13. 07:30
Megosztás:

Idén is megismételheti a tavalyi 20%-os növekedést a régió ingatlanbefektetési piaca

Idén az európai átlagnál erősebb befektetői lendületet mutat a közép-kelet-európai kereskedelmi ingatlanpiac, miközben a piaci szereplők a tranzakciós aktivitás élénkülésére és fokozott eszközforgásra készülnek. A világ legnagyobb kereskedelmi ingatlanszolgáltató és befektetési vállalatának felmérése alapján a régióban aktív befektetők magasabb kockázatvállalási hajlandósággal, erőteljesebb vásárlási szándékkal és kedvezőbb makrogazdasági pénzügyi feltételekre építve képzelik el stratégiáikat.
2026. 02. 13. 07:00
Megosztás:

Ezek a használt autók most a magyar vevők kedvencei

Megjelent a Használtautó.hu és a Központi Statisztikai Hivatal januári közös statisztikája. Az adatok alapján a hazai használtautó-piacon egyre markánsabban a középkategória válik meghatározóvá, a piac súlypontja a 2,5–10 millió forintos árkategóriák felé tolódik. Ezzel párhuzamosan a dízelmodellek részesedése csökkent, az elektromos és hibrid autók kínálata kétszámjegyű ütemben bővült, a hibridek újra a legmagasabb átlagáron szerepelnek, miközben a modellranglistán is több jelentős helycsere történt az elmúlt egy évben.
2026. 02. 13. 06:30
Megosztás:

Tényleg ott drágulnak a lakások, ahol sok munkahely van?

Logikus felvetés, hogy ahol magas a munkanélküliség, elvándorolnak az emberek, ott alacsonyabbak a lakásárak is és kevésbé szívesen költöznek oda máshonnan. Az OTP Ingatlanpont szakértői annak próbáltak utánajárni a statisztikák alapján, hogy valóban van-e ezen tényezők között erős összefüggés.
2026. 02. 13. 06:00
Megosztás:

Toborzási válságban a cégek titkos fegyvere: Műegyetemi Állásbörze

A munkaerőpiac ma drága és kiszámíthatatlan – a műszaki és technológiai tehetségekért folytatott verseny élesebb, mint valaha. Március 10–11-én a tavaszi, Műegyetemi Állásbörze valódi találkozási pontot biztosít a hallgatók és a cégek között, ahol a személyes beszélgetések, valamint a bmejob.hu segítségével a toborzás gyorsabb, célzottabb és hatékonyabb, mint bármely online hirdetés.
2026. 02. 13. 05:30
Megosztás:

Országos Kereskedelmi Szövetség szerint az árrésstop nem tudja kezelni a drágulást

Az árrésstop alkalmatlan az áremelkedés kezelésére, erre csak az egészséges verseny képes - közölte az Országos Kereskedelmi Szövetség (OKSz) csütörtökön az MTI-vel.
2026. 02. 13. 05:00
Megosztás:

Az egyik legdrágább hiba megtakarításnál, ami miatt 30%-kal többet fizetsz

Sokan úgy gondolják, hogy a nyugdíjas éveikre gyűjtve a lehető legbiztonságosabb befektetési stratégiát kell választaniuk. A matematika azonban azt mutatja: ez a döntés akár 30 százalékkal többet vehet ki a zsebedből.
2026. 02. 13. 04:30
Megosztás:

Vény nélkül kapható gyógyszerek piacát vizsgálja a GVH

Egyes piaci szereplők versenykorlátozó magatartása, illetve erőfölénnyel való visszaélése hozzájárulhat a vény nélkül kapható gyógyszerek magas árához – ezt gyanítja a Gazdasági Versenyhivatal (GVH). A GVH ezért egyszerre két versenyfelügyeleti eljárást is indított, melyekben érintett gyógyszernagykereskedő cég, patikahálózat-üzemeltető, illetve több gyógyszergyártó vállalkozás is.
2026. 02. 13. 04:00
Megosztás:

Trump-közeli WLFI berobban: elindul a World Swap, új korszak jöhet a nemzetközi pénzátutalásokban

A kriptoszektor újabb ambiciózus szereplővel bővül: a Donald Trump családjához köthető World Liberty Financial bejelentette a World Swap nevű deviza- és remittance (nemzetközi pénzátutalási) platform elindítását. A projekt célja, hogy radikálisan csökkentse a határokon átnyúló utalások költségeit, miközben közvetlen versenyre kel a hagyományos bankokkal és pénzforgalmi szolgáltatókkal. A bejelentés ugyanakkor etikai kérdéseket is felvet a Trump Organization üzleti kapcsolatai miatt.
2026. 02. 13. 03:30
Megosztás:

450 milliós fejlesztés javítja az erdők állapotát az Őrségi Nemzeti Parkban

Az Őrségi Nemzeti Park Igazgatóság 450 millió forint uniós támogatásból teszi lehetővé, hogy az erdők természetességi állapota javuljon, egyes erdőrészletekben megszűnjön az emberi beavatkozás, és az erdők fejlődése a természetes erdődinamikai folyamatok szerint történjen - hangsúlyozta az Agrárminisztérium (AM) csütörtöki közleménye szerint a tárca természetvédelemért felelős államtitkára az Őriszentpéteren tartott projektnyitó eseményen.
2026. 02. 13. 03:00
Megosztás:

Leginkább a köztársasági elnökben bíznak a csehek

Petr Pavel államfő a legmegbízhatóbb politikus a csehek szerint, 62 százalékuknak van bizalma benne - derült ki az akadémiai CVVM közvélemény-kutató intézet országos felméréséből, amelynek eredményét csütörtökön hozták nyilvánosságra Prágában.
2026. 02. 13. 02:30
Megosztás:

Alkotmányban rögzítenék a szabad vasárnapot - De vajon miért?

Jakov Milatovic montenegrói elnök az alkotmányban rögzítené, hogy vasárnap legyen munkaszüneti nap, miután az alkotmánybíróság korábban megsemmisített egy erre vonatkozó törvényt.
2026. 02. 13. 02:00
Megosztás: