Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Mintegy 200 millió forintos fejlesztéssel javul a Natura 2000 területek állapota az Őrségben

Jelentős, 190 millió forintnyi európai uniós fejlesztés indul az Őrségi Nemzeti Park Igazgatóság területén, amely a Natura 2000 hálózat priorizált élőhelyeinek védelmét szolgálja - emelte ki Rácz András, az Agrárminisztérium természetvédelemért felelős államtitkára a szerdán, Őriszentpéteren megrendezett projektnyitó eseményen az Agrárminisztérium (AM) közleménye szerint.
2026. 01. 21. 23:00
Megosztás:

Az alacsony önkontroll állhat a problémás okostelefon

Nem a személyiségjegyek, hanem a gyenge önkontroll és a közösségi élményekből való kimaradástól való félelem (FOMO) állhat a problémás okostelefon-használat hátterében - állapította meg a Semmelweis Egyetem kutatása.
2026. 01. 21. 22:30
Megosztás:

Franciaország NATO-hadgyakorlatot javasol a Dániához tartozó szigeten

Grönlandi NATO-hadgyakorlat megtartását indítványozta szerdán Franciaország. Ezt a francia elnöki hivatal jelentette be.
2026. 01. 21. 22:00
Megosztás:

A geopolitikai átrendeződés, a klímaváltozás és az MI formálják a felelős befektetéseket 2026-ban

A geopolitikai átrendeződés, valamint a gyorsuló éghajlati és technológiai trendek alapvetően formálják át a befektetési prioritásokat és az eszközallokációt idén - derül ki az Amundi MTI-nek küldött közleményéből.
2026. 01. 21. 21:30
Megosztás:

Varsóban megkezdődött az előző kormány idején működő Igazságosság Alap pere

Megkezdődött szerdán a varsói kerületi bíróságon az előző kormány idején működő Igazságosság Alap első vádlottjainak pere, a bíró elutasította a kérelmet a tárgyalás elnapolásáról, amelyet a hat vádlottat képviselő ügyvédek nyújtottak be.
2026. 01. 21. 21:00
Megosztás:

Vitalik Buterin hátat fordít a központosított közösségi médiának – a decentralizált jövő felé tart

Vitalik Buterin, az Ethereum társalapítója újabb határozott lépést tesz a decentralizáció felé – ezúttal a közösségi média világában. Egy friss bejelentés szerint 2026-tól teljesen elhagyja a központosított platformokat, hogy kizárólag decentralizált közösségi felületeken legyen aktív.
2026. 01. 21. 20:30
Megosztás:

Bálnák hagyják el a Polkadot hálózatát 2,21 dolláros árfolyamon, hogy csatlakozzanak a Digitap ($TAP) típusú kriptopresale-ekhez 2026-ban

A 2,21 dolláros árfolyamra történő emelkedés fellélegzést jelentett a Polkadot (DOT) birtokosainak a hónapokig tartó csökkenő trend után. Azonban ez csupán rövid napfénynek bizonyult, mielőtt ismét sötét felhők gyülekeztek volna.
2026. 01. 21. 20:00
Megosztás:

Jön a 100 milliárd forintos akcióterv az éttermeknek

Jön a 100 milliárd forintos akcióterv az éttermeknek - közölte a kormány a Facebook-oldalán szerdán.
2026. 01. 21. 19:30
Megosztás:

Közvetlen tárgyalásokat akar Grönlandról Donald Trump

Közvetlen tárgyalásokat akar kezdeményezni Grönland megszerzéséről Donald Trump amerikai elnök, aki szerdán a davosi Világgazdasági Fórumon a Dániához tartozó területtel kapcsolatos vitáról is beszélt felszólalásában.
2026. 01. 21. 19:00
Megosztás:

A kormány januári rezsistopot vezet be

Januári rezsistopot vezet be a kormány, ez azt jelenti, hogy a januári fűtésnél jelentkező többletfogyasztást, annak költségeit a kormány átvállalja a családoktól - jelentette be a miniszterelnök szerdán a Facebookon.
2026. 01. 21. 18:30
Megosztás:

Kampány indul a belföldi forgalom élénkítésére

A belföldi utazási kedv élénkítését célzó kampányt indít a Visit Hungary, amelyhez szálláshelyszolgáltatók és fürdők jelentkezését várják - ismertette Csendes Olivér, a Visit Hungary vezérigazgatója a TV2 Mokka műsorában szerdán reggel.
2026. 01. 21. 18:00
Megosztás:

Bhután és a Sei összefog: blokkláncvalidátor node indul 2026-ban

Bhután, a Himalája egyik leginnovatívabb királysága, újabb mérföldkőhöz érkezett digitális stratégiájában: partnerségre lépett a Sei Development Foundationnel egy blokkláncvalidátor node telepítése érdekében. A projekt célja nem csupán a technológiai fejlődés, hanem a nemzeti szintű adómonetizáció, fintech-innováció és digitális önrendelkezés megerősítése is. A kezdeményezés azt jelzi, hogy a blokklánc technológia immár nem csupán kísérleti eszköz, hanem állami stratégiák része lehet Délkelet-Ázsiában.
2026. 01. 21. 17:30
Megosztás:

Az online piacterek kockázataira figyelmeztet az NMHH

Egyre nagyobb arányban jelennek meg hamisított vagy rossz minőségű termékek az online piactereken – mutat rá egy, a Nemzeti Média- és Hírközlési Hatóság (NMHH) megbízásából készült friss kutatás. A szakértők átfogó nemzetközi másodelemzéssel és 200 próbavásárlással vizsgálták az online piacterek megbízhatóságát, és az esetek mintegy ötödénél, összesen 37 esetben találtak valamilyen visszásságot. A tanulmány azt is megállapította, hogy hosszú távon elsősorban a gyors, átlátható és korrekt panaszkezelés alapozza meg az online piacterekbe vetett vásárlói bizalmat.
2026. 01. 21. 17:00
Megosztás:

A kínai UBTECH megállapodást kötött az Airbusszal

A kínai UBTECH humanoid robotokat fejlesztő vállalat megállapodást kötött az Airbus európai repülőgépgyártóval ipari robotok szállításáról - közölte szerdán a dél-kínai Sencsen városában működő technológiai cég.
2026. 01. 21. 16:30
Megosztás:

Stabilcoinok veszik át a globális elszámolás szerepét – Mi lesz így az XRP-vel?

A Ripple elnöke, Monica Long szerint 2026-ban új korszak kezdődik a kriptovaluták történetében: a stabilcoinok lesznek a globális pénzügyi elszámolás alaprétegei. Ezzel párhuzamosan a piac erőteljes intézményesedésen megy keresztül, a vállalati kincstárak pedig fokozatosan lépnek az on-chain térbe. De vajon milyen szerep jut ebben az új világban az XRP-nek, amelyet eredetileg épp globális elszámolási eszköznek szántak?
2026. 01. 21. 15:30
Megosztás:

Ipari méretű droglaboratóriumokat számoltak fel több európai országban

Ipari méretű, összesen 24 droglaboratóriumot számoltak Hollandiában, Belgiumban, Németországban és Lengyelországban, 85 embert előállítottak - közölte az Európai Unió hágai székhelyű rendőrségi együttműködési szervezete (Europol) szerdán.
2026. 01. 21. 15:00
Megosztás:

Tavaly 4 százalékkal nőtt a nemzetközi turisták száma tavaly

A nemzetközi turisták száma 4 százalékkal nőtt 2025-ben. Mintegy 1,52 milliárd ember utazott világszerte tavaly, közel 60 millióval több, mint 2024-ben az ENSZ madridi székhelyű idegenforgalmi szervezetének (UNWTO) keddi jelentése szerint.
2026. 01. 21. 14:30
Megosztás:

A Bitcoin beköltözött a nyugdíjasok és nyugdíjak világába is

A kriptopiac újabb mérföldkőhöz érkezett: a Delaware Life biztosítótársaság bejelentette, hogy Bitcoin-kitettséget kínál fix indexált nyugdíjbiztosítási termékeiben. A lépés mögött a BlackRock által menedzselt, szabályozott index áll, amely újabb jele annak, hogy a hagyományos pénzügyi szektor fokozatosan integrálja a digitális eszközöket. De mit jelent mindez a befektetők és a piac jövője szempontjából?
2026. 01. 21. 14:00
Megosztás:

Európa válaszút előtt: radikális vállalati lépések nélkül elmaradhat a gazdasági fordulat

Európa gazdasági jövője kritikus ponthoz érkezett. Bár az uniós intézmények és a tagállamok az elmúlt években példátlan reform- és beruházási programokat indítottak el, a kontinens versenyképességi lemaradása továbbra is jelentős az Egyesült Államokhoz és Kínához képest. Egy friss, nemzetközi figyelmet kapó tanulmány szerint a fordulat kulcsa nem kizárólag az állami intézkedésekben, hanem mindenekelőtt a nagy európai vállalatok bátor, stratégiai beruházási döntéseiben rejlik - vélekednek a McKinsey elemzői friss tanulmányukban.
2026. 01. 21. 13:30
Megosztás:

Megnőtt az érdeklődés az új építésű lakások iránt januárban

Az új építésű lakások iránti érdeklődés többéves csúcsra emelkedett 2026 elején, míg a használt lakások kereslete jelentősen visszaesett az előző év azonos időszakához képest - közölte az ingatlan.com az MTI-vel szerdán.
2026. 01. 21. 13:00
Megosztás: