Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Az Egyesült Államok megszünteti a szomáliai állampolgárok átmeneti védelmét

Az Egyesült Államok megszünteti a szomáliai állampolgárok átmeneti védelmét - közölte Kristi Noem belbiztonsági miniszter kedden.
2026. 01. 14. 08:00
Megosztás:

2025-ben a lakáscélú jelzáloghitelek volumene megközelítette a 2000 milliárd forintot

Aktivitási rekord jellemezte a lakáshitelezési piacot 2025-ben, a lakáscélú jelzáloghitelek volumene megközelítette a 2000 milliárd forintot, ami 48 százalékkal haladja meg az előző év szintjét - közölte a Duna House kedden az MTI-vel.
2026. 01. 14. 07:30
Megosztás:

MKIK: eredményes évet zárt a kamara 2025-ben

Eredményes évet zárt 2025-ben a Magyar Kereskedelmi és Iparkamara (MKIK), amely öt pillérre kezdte építeni tevékenységét, a tradícióra, a fenntarthatóságra, az innovációra és digitalizációra, a tudásra és a lendületre - közölte az köztestület kedden az MTI-vel.
2026. 01. 14. 07:00
Megosztás:

A Budapest-Belgrád vasútvonal magyarországi szakaszán megkezdődött a biztosítóberendezések sötétüzeme

A Budapest-Belgrád vasútvonalon a Soroksár-Kelebia vonalszakasz teljes hosszában megkezdődött a biztosítóberendezések sötétüzeme - jelentette be a MÁV-csoport vezérigazgatója a Facebook-oldalára kedden feltöltött videónyilatkozatában.
2026. 01. 14. 06:30
Megosztás:

Soha nem látott ügyfélforgalom mellett bővült tovább a kormányablak-hálózat

Soha nem látott ügyfélforgalom mellett bővült tovább az országos kormányablak-hálózat tavaly, így most már 320 helyszínen intézhető több mint 2500 féle ügy - tájékoztatta a Közigazgatási és Területfejlesztési Minisztérium kedden az MTI-t.
2026. 01. 14. 06:00
Megosztás:

HIPA: új támogatási lehetőség nyílt meg a vállalatok számára a tiszta technológiák területén

Magyarország sikeresen jelentette be az Európai Bizottságnál a tisztaipar-megállapodáshoz kapcsolódó beruházásokhoz nyújtható új támogatási programját, amelynek jóváhagyásával az ország az elsők között vezeti be a tiszta ipari megállapodást kiegészítő támogatási rendszert (CISAF) - közölte a HIPA Nemzeti Befektetési Ügynökség kedden az MTI-vel.
2026. 01. 14. 05:00
Megosztás:

A Lengyelország 2050 kormánykoalíciós párt feljelentést tesz a pártelnökválasztásba történt feltételezett beavatkozás miatt

A Lengyelország 2050 nevű kormánykoalíciós párt feljelentést tesz amiatt, hogy gyanúja szerint kívülről beleavatkoztak az internetes pártelnökválasztás minapi második fordulójába, amelyet emiatt érvénytelenítettek - közölte kedden a párt választmánya.
2026. 01. 14. 04:30
Megosztás:

Rekordpénz a számlákon, ezermilliárd forintról mond le a lakosság

Rekordokat dönt a folyószámlákon parkoló pénz, miközben a klasszikus megtakarítási formák sorvadnak. A számok első ránézésre megtakarítási bőséget mutatnak, ám a Blochamps Capital 5 pontos értékelése szerint ez inkább a magyar megtakarítási piac kettészakadását, a pénzügyi tudatosság komoly hiányát és döntések halogatását jelzi.
2026. 01. 14. 04:00
Megosztás:

A ZeCarb vezeti a szén-dioxid-leválasztási technológiák összehasonlítását a BS Energy braunschweigi biomassza erőművében

A ZeCarb által vezetett tanulmány az amin-eljárásra összpontosít – ez egy bevált, iparilag alkalmazott technológia (TRL 9), amely hatékonyan választja le a CO₂-t a biomassza-erőművek füstgázából.
2026. 01. 14. 03:30
Megosztás:

Horvát gazdasági miniszter: elsődleges érdek, hogy a szerbiai finomító működjön

Horvátország elsődleges érdeke, hogy a szerbiai finomító zavartalanul működjön, és hogy a Janaf horvát kőolajvezeték-üzemeltető vállalat minél nagyobb mennyiségű kőolajat szállítson, betöltve stabilizáló szerepét Horvátország és a térség energiabiztonságában - jelentette ki Ante Susnjar horvát gazdasági miniszter kedden, miután az éjszaka megindult a kőolajszállítás az Adria-kőolajvezetéken keresztül a pancsovai finomítóba.
2026. 01. 14. 03:00
Megosztás:

Ömlenek az új társasházi lakások a piacra, az árak viszont leparkoltak

Látványos fordulatot hozott a 2026-os év eleje a társasházi új lakások piacán: az ingatlan.com legfrissebb adatai szerint az elérhető lakáskínálat számottevően bővült. A vármegyeszékhelyeken 30 százalékkal több hirdetésből válogathatnak az érdeklődők, mint egy évvel korábban.
2026. 01. 14. 02:30
Megosztás:

A nyugdíjasok elkezdtek félni Magyarországon

Jobban aggódnak a magyarok a nyugdíjas éveik miatt: erősödtek a hazai dolgozók körében a nyugdíjban töltött évekkel kapcsolatos aggodalmak, és minél fiatalabb valaki, annál kevésbé bízik abban, hogy kap majd állami időskori ellátást – állapítja meg a Pénztárszövetség friss, országos kutatása.
2026. 01. 14. 02:00
Megosztás:

Kellemetlen szerkezetben ért véget 2025 Magyarországon

Ma reggel a decemberi inflációs adatok érkeztek. A KSH közleménye szerint a fogyasztói árak havi szinten 0,1 százalékkal nőttek, az éves infláció pedig 3,3 százalékra lassult az novemberi 3,8 százalékról. Az adat minimálisan meghaladta az előzetes várakozásunkat és a konszenzust. A maginfláció éves csökkent az előző havi 4,1 százalékról 3,8 százalékra: itt is a bázishatás volt a meghatározó. 2025-ben átlagosan 4,4%-kal emelkedtek az árak az előző évhez képest.
2026. 01. 14. 01:30
Megosztás:

Ingatlanértékesítés utáni adózás 2026-ban – mennyit adót kell fizetni ingatlan eladásakor?

Az ingatlanértékesítések számának növekedésével párhuzamosan 2026-ban is kiemelt jelentősége van annak, hogy a magánszemélyek pontosan tisztában legyenek az ingatlan eladásából származó jövedelem adózásának szabályaival. A személyi jövedelemadó rendszerében ez az egyik legösszetettebb terület, ahol egyetlen hibás feltételezés is jelentős adókockázatot hordozhat.
2026. 01. 14. 01:00
Megosztás:

Megvan, mennyivel drágulnak a bankszámlák idén

A Központi Statisztikai Hivatal közzétette a 2025-ös éves inflációs adatot, vagyis a fogyasztói árak tavalyi emelkedésének mértékét. Ez egyben meghatározza a bankszámlák idei maximális díjemelési mértékét, továbbá két fontos állampapír idei évi kamatmértékét is. A lakossági bankszámláknál azonban van egy csavar a díjemeléssel kapcsolatban.
2026. 01. 14. 00:30
Megosztás:

Újraalakulása óta először lép fel a Kispál és a Borz a Művészetek Völgyében

A legendás zenekar mellett velünk lesz Geszti és a Budapest Bár is. Januárban sem alszik az ország legnagyobb összművészeti fesztiválja. A jelenleg hófödte Kapolcs, Taliándörögd, Vigántpetend hármas július 24. és augusztus 2. között nyári pezsgéssel és a legjobb magyar előadókkal vár mindenkit.
2026. 01. 13. 23:59
Megosztás:

Donald Trump amerikai elnök segítséget ígért az iráni tüntetőknek

Donald Trump amerikai elnök segítséget ígért kedden az Iránban tüntetőknek, és további tiltakozásra buzdította őket a kormányzati hatalom ellen.
2026. 01. 13. 23:30
Megosztás:

Ezért fontos most ellenőrizni a biztosítási szerződéseinket

Célszerű átnézni a biztosítási szerződéseket, hogy milyen jellegű, a téli időjárás okozta kockázatokat tartalmaznak - hívja fel a figyelmet a Magyar Biztosítók Szövetsége (Mabisz) keddi közleményében.
2026. 01. 13. 23:00
Megosztás:

Nőtt tavaly a Szlovákiában gyártott gépkocsik száma

Nőtt 2025-ben a Szlovákiában gyártott gépkocsik száma, éves szinten és elérte az 1 millió 70 ezret - derült ki a szlovák Autóipari Szövetség (ZAP) kedden közzétett adataiból.
2026. 01. 13. 22:30
Megosztás:

A Bitcoin 91 000 dolláron stagnál: Miért helyezi az okos tőke a pénzét a Digitap ($TAP) offshore bankolásába?

A Bitcoin csendes időszakkal indította a 2026-os évet. Az év eleji emelkedés után a BTC az elmúlt napokat azzal töltötte, hogy oldalazott a 90 000 és 91 000 dolláros szintek között. Amíg az árfolyam a pszichológiai szempontból fontos 90 000 dollár felett marad, a piac egészében fennmarad a stabilitás; ugyanakkor az egyértelmű, hogy a lendület megtört.
2026. 01. 13. 22:00
Megosztás: