Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Donald Trump gyors lépésre sürgette Ukrajnát a háború lezárása felé vezető úton

Donald Trump gyors lépésre sürgette Ukrajnát a háború lezárása felé vezető úton. Az amerikai elnök a szombatra Floridába tervezett amerikai-orosz tárgyalási fordulóval kapcsolatban fejtette ki véleményét csütörtökön.
2025. 12. 19. 08:30
Megosztás:

Mi a helyzet most a koronavírussal?

A múlt héten stagnált a koronavírus örökítőanyagának országos átlagkoncentrációja a szennyvízben - közölte a Nemzeti Népegészségügyi és Gyógyszerészeti Központ (NNGYK) csütörtökön a honlapján.
2025. 12. 19. 08:00
Megosztás:

Orosz vezérkari főnök: több mint 300 települést foglalt el idén az orosz hadsereg

Több mint 300 települést és több mint 6300 négyzetkilométernyi területet foglalt el 2025-ben az orosz hadsereg az ukrajnai háborúban - jelentette ki Valerij Geraszimov, az orosz fegyveres erők vezérkari főnök csütörtökön Moszkvában az orosz fővárosban akkreditált külföldi katonai attasék előtt.
2025. 12. 19. 07:00
Megosztás:

Eltérően alakul az ingatlan-adásvételek száma és a jelzáloghitelezés volumene

A magyar lakás- és jelzáloghitel-piac eltérően alakul az év végére: miközben az ingatlan-adásvételek száma az őszi csúcsot követően mérséklődik, a jelzáloghitelezés – különösen a közvetítők által lebonyolított volumen – továbbra is kiemelkedő szinten alakul a lakáspiac működéséből fakadó, természetes időbeli eltolódás miatt - közölte a Független Pénzügyi Közvetítők Országos Szövetsége (FPKOSZ) csütörtökön az MTI-vel.
2025. 12. 19. 06:00
Megosztás:

Tervezési projekteket mutattak be az ÉKM vezetői a debreceni közgyűlésben

Az Építési és Közlekedési Minisztérium (ÉKM) Debrecent, illetve Hajdú-Bihart érintő fejlesztési projektjeiről, a beruházások tervezési folyamatáról tájékoztatták a tárca szakmai vezetői a város közgyűlésének tagjait csütörtökön a helyi városházán.
2025. 12. 19. 05:30
Megosztás:

Európai körkép: mennyibe kerül a lakhatásunk?

Az európai állampolgárok rendelkezésre álló jövedelmük átlagosan majdnem ötödét költik lakhatásra – derül ki az Eurostat átfogó elemzéséből. Magyarország ugyan élen járt az elmúlt években az ingatlanárak és a bérleti díjak emelkedését tekintve, azonban ezzel is csak a középmezőnyben vagyunk a teljes lakhatási költségeket illetően.
2025. 12. 19. 04:30
Megosztás:

Több mint 100 magyar gazdálkodó is tüntetett Brüsszelben

Brüsszelben több mint 100 magyar gazda vett részt az összeurópai gazdatüntetésen - közölte a Nemzeti Agrárgazdasági Kamara (NAK), illetve a Magyar Gazdakörök és Gazdaszövetkezetek Szövetsége (Magosz) csütörtökön az MTI-vel.
2025. 12. 19. 04:00
Megosztás:

Magyarország lépést tart a változásokkal a mesterséges intelligencia terén

A mesterséges intelligencia (MI) jövőre új korszakba lép: praktikus eszközből valódi digitális segítőtárssá válik. A Microsoft friss tanulmánya szerint Magyarország lépést tart a változásokkal és az infrastrukturális feltételek adottak ahhoz, hogy felzárkózzon Nyugat- és Észak Európa AI-használatban élenjáró országaihoz - közölte a cég csütörtökön az MTI-vel.
2025. 12. 19. 03:30
Megosztás:

Tűzijáték szabályok Budapesten 2025 Szilveszterén

Szilveszterkor nem tiltják be a tűzijátékokat, de az idei évben sokkal szigorúbb feltételek mellett lehet majd használni őket. A bírságok elkerülése, valamint a biztonságos ünneplés érdekében a Magyar Pirotechnikai Társaság (MAPIT), a Pirotechnikusok Érdekvédelmi Szövetsége (PÉSZ), továbbá az augusztus 20-i tűzijáték kivitelezéséért felelős Nuvu Kft. közös sajtótájékoztatón számolt be az új budapesti szabályozásról, annak várható hatásairól, továbbá a biztonságos pirotechnikai eszközhasználatról.
2025. 12. 19. 03:00
Megosztás:

Karácsony előtt fokozottan vigyáznunk kell a kiberbűnözőkkel!

Az elmúlt évek tapasztalata alapján karácsony előtt sokkal nagyobb a kockázata annak, hogy valakit internetes vásárlóként becsapjanak, mint az év más időszakában, az üzleti és otthoni biztonságtechnikai szoftvermegoldások nemzetközi szállítója, az ESET közleménye szerint a kedvező ajánlat, ár sokszor csak a becsapás egyik eszköze, a kiberbűnözők fő célja ugyanis többnyire személyes és bankkártya adatok, jelszavak megszerezése.
2025. 12. 19. 02:30
Megosztás:

Minimálbéren vagy bejelentve? Akkor 2026-tól kapaszkodj!

2026 január 1-jétől jelentősen megváltozik a minimálbér és a garantált bérminimum összege Magyarországon – derül ki a frissen kihirdetett kormányrendeletből. A döntés minden munkáltatót és munkavállalót érint, legyen szó a versenyszféráról vagy az állami szektorról. Nézzük közérthetően, mit jelent ez a gyakorlatban.
2025. 12. 19. 02:00
Megosztás:

Nincs a nyugdíjad 140.000 forint? Akkor egy jó hírünk van számodra!

140 ezer forintos határ, titkos emelés, extra pénz évente? – Kevesen tudják, de így segít az állam az alacsony nyugdíjakon. Nézzük a részleteket!
2025. 12. 19. 01:00
Megosztás:

Felújítás, ami nem csak esztétikai befektetés

Amikor felújítunk, gyakran először a látványra gondolunk: friss színek, új felületek, rendezettebb terek. De ha hosszabb távra tekintünk, hamar kiderül, hogy egy átgondolt felújítás sokkal többet jelent, mint egyszerű esztétikai változást. Tartósságot, kényelmet, fenntarthatóságot és értéknövelést hoz – olyasmit, ami évekre meghatározza az otthon működését és minőségét.
2025. 12. 18. 23:30
Megosztás:

A legfontosabb építőelemek a teljesítmény mögött

Akár az irodában, akár az edzőteremben vagy éppen a tőzsdén próbálunk helytállni, nem szabad elfelejteni, hogy a teljesítmény mögött mindig stabil alapok állnak. Ahogy a pénzügyi sikerhez átgondolt befektetésekre és jó döntésekre van szükség, úgy a fizikai és mentális teljesítmény is azon múlik, milyen erőforrásokat biztosítunk a szervezetünknek. A ShopBuilder is ebben hisz: minden teljesítmény mögött struktúra, rendszer és megfelelő alapanyag áll – legyen szó akár az edzésről, akár a munkáról.
2025. 12. 18. 23:00
Megosztás:

Kreml: Moszkva készül a Washingtonnal folytatandó tárgyalásokra

Oroszország készül az Egyesült Államokkal az ukrajnai rendezésről folytatandó tárgyalásokra, Washingtonnak Kijevvel és Brüsszellel folytatott konzultációja alapján - jelentette ki Dmitrij Peszkov, az orosz elnök sajtótitkára újságíróknak csütörtökön Moszkvában.
2025. 12. 18. 22:30
Megosztás:

Az altcoinok felülteljesítők lesznek 2026-ban a kapituláció után – A Digitap ($TAP) bankolási hasznossága révén válik az egyik legjobb kriptobefektetéssé 2026-ra

2025 végére egyre erősebb bearish (csökkenő árfolyamú) nyomás nehezedik a legtöbb jelentős kriptovalutára. Mivel a Bitcoin az 85 000 dollár körüli, kulcsfontosságú támaszszint közelében oldalaz, egyes befektetők egy újabb komoly árzuhanástól tartanak. Ennek következtében egyre inkább kialakul az a vélekedés, hogy 2026-ban az altcoinok vehetik át a vezető szerepet a kriptopiacon.
2025. 12. 18. 22:00
Megosztás:

Nyereséggel zártak a vezető nyugat-európai tőzsdék

Emelkedéssel zárták a kereskedést a vezető nyugat-európai tőzsdék csütörtökön.
2025. 12. 18. 21:30
Megosztás:

Új néven működik tovább áprilistól a Magyar Autóklub

A jövő év áprilisától Magyar Mobilitási és Autóklub néven működik tovább a Magyar Autóklub, a névváltás és az arculatfrissítés az elmúlt évek szakmai és szemléletbeli átalakulásának megnyilvánulása - közölte a szervezet csütörtökön az MTI-vel.
2025. 12. 18. 20:30
Megosztás:

A BTC 87 000 dollár alá esett, ahogy a kockázatkerülés eluralkodik: A Digitap ($TAP) staking jutalmai miatt a legjobb kriptobefektetés lehet 2026-ra

A Bitcoin 87 000 dollár alá törve gyengült, miközben a kockázatkerülő hangulat elárasztotta a piacokat. A részvényindexek elkezdtek fordulni, senki sem tudja, hány kamatcsökkentés jöhet 2026-ban, és a befektetők sokkal szelektívebben állnak hozzá a kockázatvállaláshoz.
2025. 12. 18. 20:00
Megosztás:

Diákhitel Központ: továbbra is kamatstop védi a tavaly év végéig felvett szabad felhasználású diákhiteleket

A kormány döntésének köszönhetően továbbra is érvényben marad a kamatstop a 2024. december 31-ig felvett szabad felhasználású diákhitelekre, így ezekre változatlanul 7,99 százalékos kamat vonatkozik, az ezen időpont után igényelt Diákhitel1 kamata 2026. január 1-től 8,69 százalékra mérséklődik. Változatlanul kamatmentesen áll rendelkezésre a tanulmányi önköltségre fordítható Diákhitel2, valamint a szak- és felnőttképzésben igénybe vehető Képzési Hitel is - közölte a Diákhitel Központ csütörtökön az MTI-vel.
2025. 12. 18. 19:30
Megosztás: