Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Elfogadták a hódmezővásárhelyi önkormányzat költségvetését

23,248 milliárd forintos főösszeggel elfogadták a hódmezővásárhelyi önkormányzat idei költségvetését a közgyűlés csütörtök ülésén.
2026. 02. 12. 22:30
Megosztás:

Malajzia 2026-ban élesben teszteli a ringgit stabilcoint – Jön a szabályozott digitális pénz korszaka?

Malajzia központi bankja kontrollált környezetben indítja el a ringgit-alapú stabilcoinok és tokenizált betétek tesztelését 2026-ban. A fókusz a nagykereskedelmi és határon átnyúló fizetéseken lesz – a lépés pedig akár a wholesale CBDC bevezetésének előszobája is lehet.
2026. 02. 12. 22:00
Megosztás:

Vegyesen változott csütörtök estére a forint árfolyama

Vegyesen alakult a forint árfolyama a főbb devizákkal szemben csütörtök estére a reggeli szintekhez képest a nemzetközi devizakereskedelemben.
2026. 02. 12. 21:30
Megosztás:

Indul a Medtech Kórházi Inkubátor Program

Elindul a Medtech Kórházi Inkubátor Program, amely fókuszában az orvosok által létrehozott innovációk felkarolása áll - közölte a Kulturális és Innovációs Minisztérium (KIM) innovációért felelős helyettes államtitkára csütörtökön a Facebook-odalán közzétett videójában.
2026. 02. 12. 21:00
Megosztás:

Új vezetők a BYD Magyarország élén

Új vezetői struktúrával folytatja működését a BYD Magyarország; a vállalat regionális országigazgatói pozícióját Jeremy Wang veszi át, míg a magyar divízió operatív irányításáért Rényi-Vámos Ádám felel országigazgatóként - tájékoztatta a társaság az MTI-t csütörtökön közleményben.
2026. 02. 12. 20:30
Megosztás:

Cardano és LayerZero: új szintre lép a cross-chain stratégia

A Cardano történetének egyik legfontosabb interoperabilitási lépése érkezik: a LayerZero integrációval 150+ blokklánc és több mint 80 milliárd dollárnyi omnichain eszköz válhat elérhetővé. Charles Hoskinson közben a medvepiaci hangulat ellenére is kitart a hosszú távú, bikás makrovízió mellett.
2026. 02. 12. 20:00
Megosztás:

A januári inflációs adat utat nyit a februári kamatvágásnak

A fogyasztói árak januárban 2,1%-kal haladták meg az egy évvel korábbi szintet idehaza, ami 0,1 százalékponttal alacsonyabb a mi várakozásunknál és 0,3 százalékponttal alacsonyabb a piaci konszenzusnál. Utoljára 2018 márciusában mértek ilyen alacsony inflációt itthon. A decemberi 3,3% után számítani lehetett az árak jelentős mérséklődésére, elsősorban bázishatás miatt. Az előző hónaphoz képest várakozásunknak megfelelően 0,3%-kal emelkedtek az árak, az elemzői konszenzus azonban magasabb, 0,6% volt. Az éves maginfláció nem mérséklődött olyan ütemben, mint vártuk, 3,8%-ról 2,7%-ra jött le, de ez is bőven az MNB inflációs célja alatt található.
2026. 02. 12. 19:30
Megosztás:

Nőtt a cseh lakosság elégedettsége Csehország európai uniós tagságával

Csehország európai uniós tagságával a lakosság 57 százaléka elégedett, ami a legmagasabb arány az utóbbi másfél évtizedben - derült ki abból az országos felmérésből, amelyet a STEM közvélemény-kutató ügynökség készített a tavaly októberi képviselőházi választások után.
2026. 02. 12. 19:00
Megosztás:

BlackRock BUIDL alapja megjelent az Uniswapon – 40%-ot ugrott a UNI árfolyam percek alatt

A világ legnagyobb vagyonkezelője és a DeFi egyik zászlóshajója egy platformon: a BlackRock tokenizált pénzpiaci alapja már az Uniswapen is kereskedhető. A piac villámgyorsan reagált – a UNI token fél óra alatt 40%-ot ralizott.
2026. 02. 12. 18:40
Megosztás:

Az arany diadalmenete idén is folytatódhat

A tavalyi év a tőkepiacokon az arany és ezüst árfolyamának diadalmenetéről szólt, amit a bányászvállalatok részvényei még nagymértékben felül is teljesítettek. A nemesfém reneszánszához geopolitikai és reálgazdasági okok együttállására volt szükség – melyek a jelek szerint a közeljövőben is velünk maradnak. Az MBH Befektetési Bank elemzője megvizsgálta, mi áll az arany és az aranybányász szektor értékének kiugró emelkedése mögött.
2026. 02. 12. 18:00
Megosztás:

400 új munkahelyet teremt a Kometa új óriásberuházása Kaposváron

A Kometa 99 Zrt. húsfeldolgozó cég 45 milliárd forint értékben hajt végre kapacitásbővítést Kaposváron, amelynek nyomán négyszáz új munkahely jön létre a városban - közölte Szijjártó Péter külgazdasági és külügyminiszter csütörtökön a helyszínen.
2026. 02. 12. 17:00
Megosztás:

Márciusban indul az Aster Chain mainnet – Új korszak jöhet a Perp DEX piacon

Új blokklánccal, stakinggel, governance modellel és valós eszközöket leképező szintetikus piacokkal készül áttörni az Aster. A decentralizált tőzsde (DEX) márciusban indítja el saját Layer-1 hálózatát, ami nemcsak technológiai, hanem piaci fordulópontot is jelenthet.
2026. 02. 12. 16:00
Megosztás:

Olcsó és veszélyes termékek nyomában – Globális online piactereket vizsgál az NKFH és az NNGYK

A Nemzeti Kereskedelmi és Fogyasztóvédelmi Hatóság (NKFH) és a Nemzeti Népegészségügyi és Gyógyszerészeti Központ (NNGYK) egyedülálló, országos szintű összehangolt akciót indított a harmadik országból érkező termékek átfogó fogyasztóvédelmi ellenőrzése keretében. A kezdeményezés célja, hogy a népszerű online piacterekről származó termékeket átvizsgálják és feltárják, mely árucikkek jelenthetnek valós kockázatot a magyar családok számára.
2026. 02. 12. 15:30
Megosztás:

Kína csökkentett vámokat vet ki az Európai Unióból származó egyes tejtermékekre

Kína péntektől öt évre 7,4 és 11,7 százalék között kiegyenlítő vámot vet ki bizonyos, az Európai Unióból importált tejtermékekre, ezzel csökkenti a korábbi 21,9-42,7 százalékos ideiglenes vámtételeket - közölte csütörtökön a kínai kereskedelmi minisztérium.
2026. 02. 12. 15:00
Megosztás:

Kilenc éve tartó emelkedő csatornában az XRP – Intézményi tőke érkezhet 2026 elején?

Az XRP árfolyama ugyan rövid távon gyengült, de a hosszú távú technikai struktúra továbbra is stabil. A piaci szereplők figyelme egyre inkább az intézményi belépés felé fordul, miközben a spekulatív túlfűtöttség fokozatosan lecseng. Vajon egy új, érettebb piaci ciklus küszöbén állunk?
2026. 02. 12. 14:30
Megosztás:

Tarolnak a szabad felhasználású kölcsönök, egy átlagos igénylő 5 évre tervez eladósodni

Közel 3 millió forint, bő 5 éves futamidő és szabad felhasználás – így jellemezhető az átlagos személyi kölcsön a Bank360 oldalán végrehajtott kalkulációk alapján. A szabad felhasználású személyi hitel évek óta töretlen népszerűségnek örvend, 2025-ben rekordösszeget folyósítottak belőle a hitelintézetek. A pénzügyi szakportál adatai alapján pedig az is kiderül, hogy mire keresnek leggyakrabban az igénylők.
2026. 02. 12. 14:00
Megosztás:

Balesetekhez kapcsolt nyereményjáték miatt bírságolt a médiatanács

Balesetekhez kapcsolt nyereményjáték miatt bírságolt a médiatanács. A tragédiákhoz kapcsolódó nyereményjáték közzététele nem egyeztethető össze az emberi méltóság tiszteletét megkövetelő, a demokratikus nyilvánosság érdekeit szolgáló alkotmányos értékekkel – fogalmazott egyik friss határozatában a Nemzeti Média- és Hírközlési Hatóság (NMHH) Médiatanácsa.
2026. 02. 12. 13:30
Megosztás:

A vártnál gyengébben nőtt a brit gazdaság év végén

A vártnál lassabb növekedéssel zárta a tavalyi évet a brit gazdaság.
2026. 02. 12. 13:00
Megosztás:

Helyi üzletemberek vásárolják meg a Carrefour romániai hálózatát

Kivonul Romániából a Carrefour, a kiskereskedelmi hálózatát a Paval Holding vásárolja meg - írja a profit.ro a cég közleménye alapján.
2026. 02. 12. 12:30
Megosztás:

Pár bázisponttal emelkedtek az amerikai kötvényhozamok

A vártnál alacsonyabb kínai inflációs adatok miatt ismét hozameséssel indult a kereskedés a világ kötvénypiacain, de a vártnál minden fronton – munkahelyteremtés, munkanélküliség, munkabérek – erősebb januári amerikai munkapiaci adatok megfordították a hangulatot. Végül az amerikai kötvényhozamok pár bázisponttal emelkedtek, de a tízéves hozam így is 4,2% alatt zárt. Az európai kötvénypiacokon nem volt érdemi elmozdulás, a német tízéves hozam maradt 2,8% környékén. Az erős munkapiaci adatok után erőre kapott a dollár, az EUR/USD délutánra ismét 1,19 alá süllyedt.
2026. 02. 12. 12:00
Megosztás: