Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

A várakozásokkal szemben csökkent a német ipari termelés januárban

Januárban a várt növekedés helyett csökkent a német ipari termelés a német szövetségi statisztikai hivatal, a Destatis hétfőn publikált jelentése szerint.
2026. 03. 09. 13:30
Megosztás:

Bitcoin-bányászat a világűrben: egy startup új korszakot nyithat a kriptoiparban

A kriptobányászat jövője szó szerint kiléphet a Földről. Egy Nvidia által támogatott űrtechnológiai startup azt tervezi, hogy még idén Bitcoin-bányászatba kezd az űrben, ami alapjaiban változtathatja meg az iparág energiafelhasználását és gazdasági modelljét. A vállalat vezetője szerint a világűr ideális helyszín lehet a hatalmas energiaigényű bányászati infrastruktúra számára.
2026. 03. 09. 13:00
Megosztás:

Geopolitikai feszültségek hatására emelkedtek a kötvényhozamok

Az Egyesült Államok és Izrael Irán elleni offenzívája, illetve az iráni válaszcsapások – a Hormuzi-szoros lezárása és a régiós energia-infrastruktúra ellenti támadások – a múlt hétvégén jelentős sokkot okoztak a nyersanyag- és a részvénypiacok mellett a kötvény- és a devizapiacokon is. Miután az olajárak pénteken 10, egy hét alatt 50%-kal, az európai gázárak pedig pénteken 4, egy hét alatt 70%-kal ugrottak, újból elhatalmasodtak az inflációs félelmek.
2026. 03. 09. 12:30
Megosztás:

Nagyot ugrott az év elején a személyi kölcsönök átlagos összege

Folytatódik az átlagos hitelösszeg emelkedése a személyi hiteleknél, a januárban megkötött szerződések alapján már meghaladta a 3,4 millió forintot – hívja fel a figyelmet Fülöp Norbert Attila, a BiztosDöntés.hu pénzügyi szakértője. Az emelkedést – teszi hozzá – az igényelhető maximális hitelösszegek növekedése, és a kamatok fokozatos csökkenése is elősegítheti.
2026. 03. 09. 12:00
Megosztás:

Olajár-sokk és inflációs adatok rázkódtathatják meg a kriptopiacot ezen a héten

Mozgalmas és idegőrlő hét vár a kriptobefektetőkre: a globális piacok figyelme most egyszerre irányul az elszabaduló olajárakra és az Egyesült Államok kulcsfontosságú inflációs adataira. Miközben az energiaárak új csúcsokra emelkednek, a kriptopiac ismét eséssel kezdte a hetet, ami azt jelzi, hogy a geopolitikai feszültségek és a makrogazdasági hírek egyre erősebben hatnak a digitális eszközök árfolyamára.
2026. 03. 09. 11:30
Megosztás:

A hétvégén is folytatódott a háború, új vezetőt választottak Iránban

A hétvége folyamán több iráni forrás is jelezte, hogy előrehaladott állapotban van az utódlás. A jelölést vezető Hosseinali Eshkevari vallási vezető például videóüzenetben utalt arra, hogy Khamenei ajatollah utódjául fiát, Mojtabát választhatják, és ezt hétfő reggelre hivatalosan meg is erősítették.
2026. 03. 09. 11:00
Megosztás:

Jelentős indexveszteség az európai tőzsdék nyitásakor

Nagy indexveszteséggel indult a kereskedés hétfőn a főbb európai értékpapírpiacokon. Az olajár megugrott, az arany ára pedig a dollár erősödését tükrözve csökkent.
2026. 03. 09. 10:30
Megosztás:

Jelentősen csökkentek a részvények a Wall Streeten, tovább emelkedett az olaj ára

A Wall Street három fő indexe eséssel zárt pénteken, miután hirtelen romlás mutatkozott az amerikai munkaerőpiacon, és az Egyesült Államokban az olajárak jelentősen megugrottak a közel-keleti konfliktus eszkalálódása miatt. A Dow 0,9%-kal, az S&P 500 1,3%-kal, a NASDAQ 1,6%-kal csökkent, ezzel mindhárom index jelentős negatívban zárta a hetet, a Dow 3%-kal, az S&P 2%-kal, a Nasdaq pedig 1,2%-kal zárt alacsonyabban a hét egészét tekintve. A bankszektor 2,0%-ot esett, melyhez hozzájárult a BlackRock 7,1%-os esése, miután a vagyonkezelő korlátozta a pénzkiutalásokat.
2026. 03. 09. 10:00
Megosztás:

Régóta az egyik legrosszabb hetüket zárták az európai indexek

Egy százalékos pénteki esését követően a STOXX 600 index közel egy éve nem látott heti esést produkált pénteken, miután 5,5%-kal csökkent a hét egészében, köszönhetően a fokozódó közel-keleti bizonytalanságnak, illetve a negatív meglepetésnek az amerikai foglalkoztatottsági adatokban, mely árnyalja a Fed kamatpályáját. Pénteken a DAX 0,9%-kal, a CAC 40 0,7%-kal, az FTSE 100 1,2%-kal csökkent.
2026. 03. 09. 09:30
Megosztás:

Elérte a 300 000 felhasználót a Wordy, a magyar fejlesztésű nyelvtanuló app

Wordy alkalmazás 300 000 felhasználót ért el világszerte – a magyar startup filmek és sorozatok klipjeivel tanít idegen szavakat, és 2026 végére egymillió felhasználót céloz meg.
2026. 03. 09. 08:30
Megosztás:

Beindult a fagylaltturizmus

Ahogy kisüt a nap, éled a természet és a Balaton, lassan ébrednek téli álmukból a fagylaltozók is. Sokakat várnak a március 15-i hétvégére a tó környékére, és hogy az első tavaszi napsugaraknak legyen mit felolvasztani, lássuk, milyen jeges édességekkel készülnek a cukrászmesterek!
2026. 03. 09. 08:00
Megosztás:

Gyengült a forint hétfő reggelre

Gyengült a forint hétfő reggelre a főbb devizákkal szemben a péntek esti jegyzéséhez képest a nemzetközi devizakereskedelemben.
2026. 03. 09. 07:30
Megosztás:

Gyakorlatilag megállt a horvát orvosok külföldre vándorlása

Gyakorlatilag megállt a horvát orvosok külföldre vándorlása, miután az utóbbi években közel kiegyenlítődött a távozók és a hazatérők száma - írta vasárnap a Vecernji List című horvát napilap a Horvát Orvosi Kamara (HLK) adataira hivatkozva.
2026. 03. 09. 06:00
Megosztás:

Hol lehet a Bitcoin 2036-ban?

A Bitcoin árfolyama jelenleg nyomás alatt áll: a 2025 októberi csúcs óta közel 46%-ot esett. A rövid távú mozgások azonban nem feltétlenül tükrözik a hosszabb távú trendeket. Az elmúlt tíz évben a Bitcoin értéke több mint 16 000%-kal nőtt, ami jól mutatja, milyen erős növekedést produkált a digitális eszköz.
2026. 03. 09. 05:00
Megosztás:

Az orosz külügyminiszter szerint össze kell hívni az ENSZ BT állandó tagjainak csúcstalálkozóját

Legfőbb ideje összehívni az ENSZ Biztonsági Tanácsa öt tagjának csúcstalálkozóját - jelentette ki Szergej Lavrov orosz külügyminiszter a Rosszija 1 televízió Moszkva. Kreml. Putyin vasárnapi magazinműsorában.
2026. 03. 09. 04:00
Megosztás:

Telefonon egyeztetett a brit kormányfő és az amerikai elnök az elmúlt napok vitái után

Telefonon egyeztetett vasárnap Keir Starmer brit miniszterelnök és Donald Trump, az Egyesült Államok elnöke az iráni hadműveletekről. Ez volt a két vezető közötti első közvetlen kapcsolatfelvétel az elmúlt napok ismétlődő, nem egyszer éles hangvételű személyes vitái után.
2026. 03. 09. 03:00
Megosztás:

8200 ajánlóívet nem vittek vissza a jelöltek, jelölőszervezetek

Országosan több mint 8200 ajánlóívet nem vittek vissza a jelöltek, jelölőszervezetek az áprilisi országgyűlési választásra szóló ajánlásgyűjtés után - derül ki a Nemzeti Választási Iroda (NVI) tájékoztatásából.
2026. 03. 09. 02:00
Megosztás:

Megérkezett Brüsszelbe a Közel-Keletről hazatérőket szállító első repülőjárat

Vasárnap reggel a Brüsszeli Zaventem nemzetközi repülőtéren landolt az első repülőjárat, amely belgákat és más uniós országok állampolgárait szállította a Közel-Keletről. Amszterdamban péntek éjjel érkezett a hazatérőket szállító első járat a régióból.
2026. 03. 09. 01:00
Megosztás:

Egy váratlan csomag érkezése is lehet internetes csalás

Az internetes bűnözők egyre többször csalnak váratlan csomagokkal, s bár először szerencsés véletlennek is tűnhet egy meg nem rendelt csomag érkezése, a háttérben gyakran kifinomult online csalás, az úgynevezett brushing scam állhat - figyelmeztetnek az ESET kiberbiztonsági szakértői.
2026. 03. 08. 23:00
Megosztás:

Olaszországban általános sztrájk lesz hétfőn

A közlekedés kivételével minden állami és magán ágazatot érint az olasz szakszervezetek által hétfőre meghirdetett általános sztrájk, amelyet a nemzetközi nőnap alkalmával a nemek közötti egyenlőségért tartanak.
2026. 03. 08. 22:00
Megosztás: