Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

A WLFI új staking modellt és USD1-ösztönzőket vezetne be

A Trump család támogatását élvező kriptovállalkozás, a World Liberty Financial (WLFI) új javaslatot terjesztett elő, amely egyszerre reformálná a governance rendszert és pörgetné fel a saját stabilcoinja, az USD1 használatát. A terv középpontjában egy 180 napos staking alapú szavazási modell és célzott DeFi-ösztönzők állnak – mindezt egy olyan piacon, ahol továbbra is az USDC és az USDT dominál.
2026. 02. 26. 12:30
Megosztás:

Újból elérhető a lakossági távhőpályázat

Csütörtöktől újból elérhető a lakossági távhőpályázat - jelentette be hivatalos Facebook-oldalán az Energiaügyi Minisztérium (EM).
2026. 02. 26. 12:00
Megosztás:

A nettó keresetek jobban emelkednek mint a bruttók

Hónapok óta az látható, hogy a nettó keresetek nagyobb arányban növekednek, mint a bruttók - jelentette ki a Nemzetgazdasági Minisztérium (NGM) foglalkoztatáspolitikáért felelős államtitkára csütörtökön az M1 aktuális csatornán.
2026. 02. 26. 11:30
Megosztás:

Átlépte az 1 billió dollárt az Aave hitelezése

Az RWA-piacok megnyitása új korszakot indíthat a DeFi-ben. Az Aave történelmi mérföldkőhöz érkezett: a protokoll kumulatív hitelezési volumene meghaladta az 1 billió dollárt, miközben elindult a Horizon nevű, intézményi szereplőkre szabott RWA-piac. A rekord nemcsak a decentralizált hitelezés (DeFi lending) iránti tartós keresletet mutatja, hanem azt is, hogy az on-chain hitelpiac egyre szorosabban kapcsolódik a hagyományos pénzügyi szektorhoz (TradFi).
2026. 02. 26. 11:00
Megosztás:

Két-három hét alatt Velencei-tónyi szennyvíz keletkezik Magyarországon

Űrhajókon is használt megoldással csökkentik 30–50 százalékkal a szennyvíztisztító telepek energiaigényét.
2026. 02. 26. 10:30
Megosztás:

Jelentősen erősödött a forint, nagyot estek a hazai hozamok, az ÁKK újabb 1,2 milliárd euró értékű devizaforrást vonhatott be zárt körben

Folytatódott az irány nélküli kereskedés a fejlett gazdaságok kötvénypiacain, a tízéves amerikai hozam maradt 4,05, a német 2,7% körül. A dollár kissé gyengült, az euró erősödött, így az EUR/USD 1,18-ig emelkedett.
2026. 02. 26. 10:00
Megosztás:

Visszatért az optimizmus az AI-jal kapcsolatban, meredeken emelkedett a NASDAQ

A Wall Street szerdán emelkedéssel zárt, folytatva a technológiai részvények vezette ralit, és kéthetes csúcsokat ért el, köszönhetően annak, hogy az AI-jal kapcsolatos aggodalmak háttérbe szorultak az új technológia lehetséges előnyeivel kapcsolatos, újjáéledő optimizmus miatt.
2026. 02. 26. 09:30
Megosztás:

Rekordon zártak a főbb európai indexek

Rekordmagasságba került a legtöbb vezető európai index, köztük a DAX (+0,8%), a CAC 40 (+0,5%), az FTSE 100 (+1,2%) és így a pán-európai Stoxx 600 is (+0,7%).
2026. 02. 26. 09:00
Megosztás:

Szolgálati lakások épülnek Balatonfüreden

Két épülettömbben 16 szolgálati lakás épül összesen mintegy másfél milliárd forintértékben. A lakóházak a tervek szerint jövő nyárra készülnek el - közölte szerdán, Balatonfüreden az Építési és Közlekedési Minisztérium magasépítésért felelős helyettes államtitkára.
2026. 02. 26. 08:30
Megosztás:

Ebben a városban megduplázzák a turisztikai adót!

A turisztikai adó megduplázásáról határozott a katalán regionális parlament szerdán Barcelonában.
2026. 02. 26. 08:00
Megosztás:

A kerékpáros turizmust segítő fejlesztések indulnak Csongrád-Csanád vármegyében

A kerékpáros turizmust segítő fejlesztések indulnak uniós támogatással Csongrád-Csanád vármegyében, a EuroVelo 11 útvonal mentén - tájékoztatta a beruházásra létrejött konzorciumot vezető csongrádi önkormányzat az MTI-t.
2026. 02. 26. 07:30
Megosztás:

A várakozást meghaladóan nőtt a Magyar Telekom nyeresége az utolsó negyedévben

A Magyar Telekom árbevétele 2025. negyedik negyedévben 0,6 százalékkal 258,1 milliárd forintra emelkedett, az adózott eredmény pedig 18,3 százalékkal 44,7 milliárd forintra nőtt a cég szerdán közzétett jelentése szerint. A társaság tőzsdezárás után közölte azt is, hogy az igazgatóság javaslata alapján a 2025. évi osztalék várhatóan részvényenként 154 forint lesz.
2026. 02. 26. 07:00
Megosztás:

Kettészakadhat a fővárosi panelpiac

Országos szinten 24 százalékkal visszaesett az eladó használt lakóingatlanok iránti telefonos érdeklődés, ugyanakkor a panellakások népszerűsége stabilan megmaradt, mivel ezek iránt a kereslet jóval kisebb mértékben csökkent, mint a téglaépítésű lakásoké az ingatlan.com friss elemzése szerint. Az Otthon Start Program és az első lakásvásárlókat célzó budapesti beruházások viszont kettészakíthatják a fővárosi panellakások piacát.
2026. 02. 26. 06:30
Megosztás:

Spanyolország betiltaná az energiaitalokat a 16 év alattiak számára

Spanyolország betiltaná az energiaitalok értékesítését a 16 év alattiak számára - jelentette be Pablo Bustinduy, a szociális jogokért és fogyasztóvédelemért felelős miniszter szerdán Barcelonában.
2026. 02. 26. 06:00
Megosztás:

Elfogadták Budapest csapadékvíz-gazdálkodási stratégiáját

Elfogadta Budapest csapadékvíz-gazdálkodási stratégiáját szerdán a Fővárosi Közgyűlés, a dokumentum a többi mellett intézkedéseket határoz meg a csapadékvíz helyben tartására, hasznosítására és a káros hatások mérséklésére.
2026. 02. 26. 05:30
Megosztás:

Zöld utat kapott a teljes digitális jegyrendszer Budapesten

2028-ban elindulhat az e-jegyrendszer a teljes budapesti és agglomerációs közösségi közlekedési hálózaton, a Budapesti Közlekedési Központ (BKK) elindíthatja az ehhez szükséges közbeszerzési eljárást, miután a koncepciót a Fővárosi Közgyűlés szerdai ülésén támogatta - közölte a szervezet szerdán az MTI-vel.
2026. 02. 26. 05:00
Megosztás:

A turisztikai adó duplázásáról határozott a katalán regionális parlament

A turisztikai adó megduplázásáról határozott a katalán regionális parlament szerdán Barcelonában.
2026. 02. 26. 04:30
Megosztás:

Hol a legjobb és hol a legrosszabb a lakáskínálat? Megmutatjuk a különbségeket

A magyar lakásállomány állapota vegyes képet mutat: miközben az elmúlt években egyre több korszerű, energiahatékony új építésű lakás jelent meg a piacon, az ingatlanok jelentős része továbbra is elöregedett. A zenga.hu kínálata alapján megnéztük, hol vannak a legjobb és legrosszabb állapotú lakóingatlanok Magyarországon.
2026. 02. 26. 04:00
Megosztás:

Montenegró az év végéig le akarja zárni az uniós csatlakozási tárgyalások minden fejezetét

A montenegrói kormány bejelentette szerdán, hogy az év végéig lezárja az uniós csatlakozási tárgyalások minden fejezetét, valamint hogy a leendő tagságra készülve a nemzeti légitársaság erre utaló felirattal látta el az egyik repülőgépét.
2026. 02. 26. 03:30
Megosztás:

Izland népszavazást készít elő az uniós csatlakozási tárgyalások folytatásáról

A következő hónapokban Izland elő fogja készíteni a népszavazást arról, hogy az ország újból megnyissa-e a csatlakozási tárgyalásokat az Európai Unióval - közölte Kristrún Frostadóttir izlandi miniszterelnök szerdán Varsóban, a Donald Tusk lengyel kormányfővel közös sajtóértekezleten.
2026. 02. 26. 03:00
Megosztás: