Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Békés vármegye két báromfitelepén is megjelent a madárinfluenza

A Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) laboratóriuma Békés megyében két báromfitelepen magas patogenitású madárinfluenza vírus jelenlétét igazolta, az érintett állományok felszámolása folyamatban van - tájékoztatta a hivatal kedden az MTI-t.
2026. 01. 27. 22:30
Megosztás:

Ezeket a biztonsági jeleket mindenkinek érdemes ismerni

A biztonsági jelzések nem csupán ipari környezetben, hanem a mindennapokban is életmentőek lehetnek. Ezek a szimbólumok gyors és egyértelmű információt adnak veszélyekről, teendőkről vagy menekülési útvonalakról. Ha nem ismerjük fel őket, komoly kockázatnak tesszük ki magunkat és másokat.
2026. 01. 27. 21:30
Megosztás:

Kedden erősödött a forint az euróval és a dollárral szemben

A forint erősödött kedden az euróval és a dollárral szemben a kora reggeli jegyzéséhez képest a bankközi piacon, a svájci frank ellenében viszont árfolyama szinte nem változott.
2026. 01. 27. 20:00
Megosztás:

Pozitív zárás az európai tőzsdéken

A vezető európai részvényindexek többsége emelkedéssel zárta a keddi kereskedést, Frankfurt kivételével.
2026. 01. 27. 19:30
Megosztás:

Kína: Japánnak nincs joga nyilatkozni Tajvan kérdésében

Japánnak sem történelmi, sem jogi alapon nincs joga megjegyzéseket tenni Tajvan kérdésében – jelentette ki kedden a kínai külügyminisztérium szóvivője.
2026. 01. 27. 19:00
Megosztás:

Pánikhangulat a kriptopiacon: Rekordmértékű, 1,73 milliárd dolláros tőkekivonás sújtotta a digitális eszközöket

A kriptopiac ismét nyomás alá került: a befektetők egyetlen hét alatt több mint 1,7 milliárd dollárt vontak ki a digitális eszközökből. A legnagyobb vesztes a Bitcoin lett, de az Ethereum és az XRP is jelentős kiáramlást szenvedett el. Eközben néhány altcoin – köztük a Solana – továbbra is vonzza a kockázatvállaló tőkét. Vajon csak átmeneti korrekcióról van szó, vagy újabb medvepiac bontakozik ki?
2026. 01. 27. 18:30
Megosztás:

Magyarország 2026 – a stagnálásból való fordulat, de nyitott kockázatokkal

A magyar gazdaság 2026-ban a hároméves stagnálást követően várhatóan visszatér a növekedéshez. A GDP ütemének várható gyorsulását azonban elsősorban átmeneti tényezők – az előválasztási fiskális ösztönzők, az alacsony infláció rövid időszaka és az új ipari kapacitások fokozatos beindulása – hajtják. Tehát nem a fundamentumok átfogó javulásáról van szó, hanem egy törékeny fordulatról, amely fenntarthatóságát már az év második felében próbára teszi.
2026. 01. 27. 17:30
Megosztás:

XRP és arany a pénzügyi rendszer új hajnalán – Közeleg a globális pénzügyi újraindítás?

Egyre több gazdasági elemző szerint a világ a pénzügyi rendszer radikális átalakulása felé halad. A Black Swan Capital alapítója, Versan Aljarrah szerint már láthatóak az átalakulás jelei – és két eszköz játszhat kulcsszerepet ebben a történelmi fordulatban: az arany és az XRP. De mi áll a háttérben, és miért most válik mindez különösen fontossá?
2026. 01. 27. 17:00
Megosztás:

A növekedés rejtett akadálya: amikor az ingatlan már nem követi a vállalkozást

Egy vállalkozás növekedése kívülről sikertörténetnek tűnik. Több megrendelés, nagyobb csapat, bővülő tevékenység. Belülről azonban gyakran egészen más képet mutat: egyre szűkösebb terek, kompromisszumos megoldások, ideiglenes átalakítások és egyre több „majd később megoldjuk” típusú döntés. Sok cégvezető csak akkor szembesül a problémával, amikor a telephely már nem kiszolgálja, hanem akadályozza a működést. Pedig a növekedés egyik legkritikusabb – és gyakran alulértékelt – tényezője éppen az ingatlan. Nem az számít, hogy hol működik ma a vállalkozás, hanem az, hogy hol tud működni holnap is.
2026. 01. 27. 16:30
Megosztás:

NAK: a megkárosított gazdák segítséget kapnak

Az állam méltányossági alapú rendkívüli kárrendezést nyújt azoknak a termelőknek, akiknek a BÁSZNA Gabona Zrt. nem fizetett. A kérelmek elbírálásáért a Nemzeti Agrárgazdasági Kamara (NAK) felel - közölte NAK és a Magyar Gazdakörök és Gazdaszövetkezetek Szövetsége (MAGOSZ) kedden sajtóközleményben.
2026. 01. 27. 16:00
Megosztás:

Megjelent az Otthontámogatásról szóló rendeletmódosítás

Megjelent a Magyar Közlönyben az a rendelet, amely több ponton is módosítja az évi nettó 1 millió forintos vissza nem térítendő Otthontámogatásról szóló korábbi kormányrendeletet. Az új rendelet szövege szerint „a nagy érdeklődésre való tekintettel” 2026. február 15-ig meghosszabbításra kerül az igénylési határidő, továbbá a jogosultak köre is bővül – írja közleményében a Bank360.
2026. 01. 27. 15:30
Megosztás:

Szintet lép a víziközművagyon védelme, de szemléletváltást is sürget a szakértő

Jelentős változás előtt áll a hazai víziközműszektor: idén február 1-jén hatályba lép egy, a napokban megjelent rendelet, amely alapjaiban írja át a Víziközmű-fejlesztési és Ellentételezési Alap működését. Az új szabályozás célja a nemzeti vagyon védelme és a hálózati veszteségek radikális csökkentése. Azonban a szakértő arra figyelmeztet: a pénzügyi keretek mellett a kivitelezés minőségének szigorítása is elengedhetetlen.
2026. 01. 27. 15:00
Megosztás:

Mit kell tudni a csendes refluxról?

Egy olyan állapotról beszélünk, amit sok esetben nehezen ismernek fel, a tünetei pedig eltérőek lehetnek a hagyományos gastrooesophagealis reflux betegség tüneteitől. A csendes reflux, orvosi nevén laryngopharyngeal reflux (röviden LPR) esetén a betegek hosszú ideig van, hogy nem kapnak megfelelő diagnózist és így kezelést sem
2026. 01. 27. 14:30
Megosztás:

Visszatekerik a kilométerórát Magyarországon a külföldről behozott autók sokaságánál - honnan lehet tudni?

Bár a használt autók között Európa-szerte jelentős arányt képviselnek az import autók, a vásárlóknak érdemes gondosan mérlegelniük a kockázatokat, mielőtt döntést hoznak. Az országok közötti adatmegosztás hiánya miatt a piacot továbbra is nagy számban jellemzik a manipulált futásteljesítményű autók.
2026. 01. 27. 13:30
Megosztás:

Nagy ütemben bővül az újlakás-kínálat a fővárosban

Tavaly sem mérséklődött a pezsgés a fővárosi újlakás-piacon. Főleg a kínálat duzzad látványosan, miközben az Otthon Start Programhoz kötődően érdekes anomáliaként egyes városrészekben összeért a panelek és az új projektek lakásainak árszintje – derül ki az OTP Jelzálogbank legfrissebb, publikus beruházói és értékesítői adatokból összeállított Budapesti Újlakás Értéktérképéből.
2026. 01. 27. 13:00
Megosztás:

Kína kész együttműködni Finnországgal

Kína kész együttműködni Finnországgal az Egyesült Nemzetek Szervezetére (ENSZ) épülő nemzetközi rendszer megőrzésében és egy többpólusú világrend előmozdításában - jelentette ki Hszi Csin-ping kínai elnök Petteri Orpo finn miniszterelnökkel folytatott keddi megbeszélésén Pekingben.
2026. 01. 27. 12:30
Megosztás:

Több mint 1000 milliárd forint összegben igényelték a vállalkozások a fix 3%-os kkv hiteleket

Magyarország forrásainak nem Ukrajnában, hanem a hazai kkv-knál van a helye! Ezért a Kormány a piaci hiteleknél jóval kedvezőbb kamattámogatott konstrukciókat tesz elérhetővé, ezáltal biztosítva kedvezményes forrást a vállalkozások számára.
2026. 01. 27. 12:00
Megosztás:

Vegyszermentes technológiák a víztisztításban: klór helyett akár UV-fénnyel vagy ózonnal is fertőtleníthető az ivóvíz

Az ózon és UV használatával akár egy teljes nagyságrenddel csökkenteni lehet a vegyszerfelhasználást az ívóvízhálózatokban.
2026. 01. 27. 11:30
Megosztás:

Horvátországban minden hatodik jármű közlekedésre alkalmatlan

A műszaki vizsgán ellenőrzött járművek csaknem 17 százaléka bizonyult közlekedésre alkalmatlannak 2025-ben Horvátországban - közölte a horvát járműközpont (CVH).
2026. 01. 27. 11:00
Megosztás:

Mindent elsöpört az azonnali fizetés, az utalások többsége pillanatok alatt megérkezik

Ma már egyértelműen kijelenthető, hogy az Azonnali Fizetési Rendszer (AFR) vált a magyar pénzforgalom meghatározó formájává – hangsúlyozza Gergely Péter, a BiztosDöntés.hu pénzügyi szakértője. A jegybank statisztikái szerint három banki átutalásból kettő már ezen a rendszeren keresztül, legfeljebb öt másodperc alatt teljesül.
2026. 01. 27. 10:30
Megosztás: