Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Horvátországban jön az egységes elektronikus útdíjfizetési rendszer

A horvát parlament hétfőn elfogadta az új útdíjszedési törvényt, amelynek értelmében 2027. március 1-jétől egységes elektronikus útdíjfizetési rendszert vezetnek be Horvátország teljes autópálya-hálózatán.
2025. 12. 15. 17:00
Megosztás:

Új lendületet adhat a SZÉP Kártyáknak a digitalizáció

A SZÉP Kártyák digitalizációja új lendületet adhat a felhasználásnak, hiszen egyszerűbb és kényelmesebb fizetési lehetőséget kínál az ügyfeleknek, mintha minden egyes fizetésnél elő kellene venni a fizikai kártyát a pénztárcájukból. Az MBH SZÉP Kártya digitalizálása Android és iOS rendszeren is elérhető, így az ügyfelek néhány lépésben hozzáadhatják SZÉP Kártyájukat a mobiltárcájukhoz. Az MBH Bank és a Visa, a világ egyik vezető digitális fizetési szolgáltatójának közös fejlesztésének köszönhetően nincs szükség új kártya igénylésére, a meglévő MBH SZÉP Kártya és a társkártyák is egyszerűen digitalizálhatók. Ez az Európában is újszerű innováció, tovább erősíti az MBH Bank lakossági szolgáltatásainak széles palettáját.
2025. 12. 15. 16:30
Megosztás:

Megalakult a Magyar Mesterséges Intelligencia Tanács

Megalakult a Magyar Mesterséges Intelligencia Tanács hétfőn Budapesten, testület egyebek mellett figyelemmel kíséri majd a területet érintő technológiai fejlődést és hatósági gyakorlatot, valamint ajánlásokat és szakpolitikai javaslatokat tesz - mondta Palkovics László mesterséges intelligenciáért felelős kormánybiztos, a tanács elnöke az alakuló ülés utáni sajtótájékoztatón.
2025. 12. 15. 16:00
Megosztás:

Lenyűgöző dekorációk

A modern lakberendezés egyik újdonsága lehet egy különleges és egyedi dísztárgy, ami szinte bármely fantáziadús belső térbe beragyog. Gondoltad volna, hogy egy kristályokkal díszített, 3D nyomtatással készült sárkány is lehet az otthonod ékessége? Ez az egyedi dekoráció, ami a mitikus lények szerelmeseinek is kedvenc darabja lehet, képes elbűvölni és varázslatos hangulatot adni a környezetednek.
2025. 12. 15. 15:30
Megosztás:

Ezeket a hibákat találták a pezsgőknél

Száraz rozé pezsgőket vizsgált a Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih), a vizsgált alkoholos italok élelmiszerbiztonsági szempontból megfelelőek voltak, jogsértő jelölés miatt azonban öt terméknél hatósági eljárás indult - közölte a Nébih hétfőn az MTI-vel.
2025. 12. 15. 15:00
Megosztás:

Januártól igényelhető a mobilszolgáltatóknál a szűrt internetszolgáltatás

A kiskorúak online térben való hatékony védelme érdekében 2026. január 1-jétől a Magyar Telekom, a One Magyarország és a Yettel Magyarország szolgáltatóknál elérhető lesz a kiskorú felhasználókra tekintettel nyújtott biztonságos mobilinternet. A szolgáltatásnyújtás részleteit a mobilszolgáltatókkal történt egyeztetést követően a Nemzeti Média- és Hírközlési Hatóság szabályozta. Az egyéni előfizetők által ingyen igényelhető szolgáltatás használata esetén a Magyarországról leggyakrabban látogatott, kifejezetten pornográf tartalmak bemutatását célzó, meghatározott honlapok mobilhálózaton nem lesznek elérhetők a gyermekek számára - közölte a hatóság kommunikációs igazgatósága hétfőn az MTI-vel.
2025. 12. 15. 14:30
Megosztás:

Minden fenyőfajból bőséges kínállattal várják a vásárlókat a hazai termelők

A hazai termelők bőséges kínálattal várják a vásárlókat, akik jellemzően minden fenyőfaj esetében magyar termelésből származó portékával találkozhatnak; országszerte közel kétmillió fenyőfa kel el a következő napokban - derül ki a Nemzeti Agrárgazdasági Kamara (NAK), valamint a Magyar Díszkertészek Szakmaközi Szervezetének közös körképéből.
2025. 12. 15. 14:00
Megosztás:

Az adatmentés világa: miért fontos előre tudni a lehetőségeket és költségeket?

A digitális eszközök mindennapossá váltak, és, bár kényelmesen tárolnak fotókat, dokumentumokat, projekteket, egy váratlan meghibásodás könnyen felboríthatja a biztonságérzetet.
2025. 12. 15. 13:30
Megosztás:

Friss kutatás: Karácsonykor túlköltenek a magyarok, januárban jön a megbánás

Bár a magyarok nagy része szerint a karácsony nem a drága ajándékokról szól, sokan mégis kicsúsznak a tervezett keretből az utolsó napokban. A magyar családok karácsonyi költekezési szokásait vizsgáló friss kutatás szerint a válaszadók jelentős része nem zárkózik el attól sem, hogy hitelből vásároljon ajándékot.
2025. 12. 15. 12:30
Megosztás:

A művészi alkotás új eszközei: a kreativitás határain túl

A kreatív játékok mindig izgalmas kihívást jelentenek a gyerekek számára, hiszen lehetőséget adnak a fantáziájuk kibontakoztatására. Az új generációs művészeti eszközök között megjelent egy különleges kellék, ami nem csupán rajzolásra, hanem igazi viaszfestmények készítésére is alkalmas.
2025. 12. 15. 12:00
Megosztás:

Vak- és gyengénlátó munkatársakkal bővíti hálózatát a Szerencsejáték Zrt.

Három látássérült kolléga csatlakozik a Szerencsejáték Zrt. munkavállalóihoz, ez újabb mérföldkő az inkluzív munkahelyi kultúra megteremtésében. A társaság több mint 20 éve foglalkoztat mozgáskorlátozott, siket, nagyothalló, valamint tartós egészségkárosodás miatt megváltozott munkaképességű kollégákat, ez bővül most a látássérültekkel.
2025. 12. 15. 11:30
Megosztás:

Fontos változások a Binance kriptotőzsde fizetési szolgáltatásai körében

A Binance bejelentette, hogy 2025. december 29-től ideiglenesen felfüggeszt több népszerű fiat fizetési módot és szolgáltatást. A lépés jogszabályi változásokhoz kapcsolódik, és többek között a Revolut, a PayPal, az Apple Pay és a Google Pay is érintett.
2025. 12. 15. 11:00
Megosztás:

Befektetési alapismeretek fiataloknak: hogyan indítsuk el a nyugdíjcélú megtakarítást 20 éves korban?

Húsz évesen a jövőbeli nyugdíjról gondolkodni a legtöbb ember számára úgy hangzik, mint a tanács, hogy hagyjuk ott a desszertet a zöldségekért. Pedig akik már rég túlléptek a harmincon, mind ugyanazt ismételgetik. Ha korábban kezdhették volna, nem vesztegették volna az időt.
2025. 12. 15. 10:30
Megosztás:

Mennyibe kerül a síbiztosítás egy napra?

Az idei szezonban naponta és személyenként átlagosan 870 forint körül alakul a síbiztosítás díja, ami mintegy 3 százalékkal haladja majd meg az előző szezon 845 forintos átlagát – jelzi előre az Insura.hu az aktuális utasbiztosítási módozatok és az eddigi, előzetesen megkötött szerződések ismeretében.
2025. 12. 15. 10:00
Megosztás:

Zsinórban negyedik éve bővül 1 gigawattnál többel a napelemes kapacitás

December elejéig mintegy 1030 megawatt új naperőművi teljesítmény épült ki Magyarországon 2025-ben. Az 1 gigawattos gyarapodást először 2022-ben haladtuk meg, azóta minden esztendőben sikerült ezt a szintet újra megugrani. A 8300 megawattot közelítő kapacitásból több mint 5000 megawattot ebben a négy évben telepítettek - jelentette be hétfőn hivatalos Facebook-oldalán az Energiaügyi Minisztérium (EM).
2025. 12. 15. 09:30
Megosztás:

Lakhatási válság van – de kinek segít a magyar lakáspolitika?

Ígylakunk-interjú - Az elmúlt években a magyar lakáspolitika középpontjában a támogatások álltak: kedvezményes hitelek, adókedvezmények, programok sora ígérte a lakhatás megkönnyítését. A felszínről nézve a rendszer bőségesnek tűnik, mégis egyre többen szorulnak ki a megfizethető lakhatásból. Czirfusz Mártonnal, a Periféria Közpolitikai és Kutatóközpont egyik alapítójával arról beszélgettünk, mit jelent valójában a lakhatási válság Magyarországon, kiket érnek el – és kiket hagynak ki – a támogatások, mennyire szolgálja a megfizethetőséget az állami beavatkozás, és milyen elvek mentén lehetne igazságosabb és hatékonyabb lakáspolitikát felépíteni.
2025. 12. 15. 09:00
Megosztás:

Karácsonykor sok családnál fokozódik a pénzügyi nyomás

Az ünnepek közeledtével sok családnál fokozódik a pénzügyi nyomás, hiszen az ajándékokra és a dekorációra fordított kiadások gyakran megterhelik a családi költségvetést. Kutatások szerint a felnőttek mellett, a gyerekek is szoronganak a pénzügyi bizonytalanságok miatt. Egy osztrák vizsgálat szerint: a 14–25 évesek 17%-a már találkozott adóssággal vagy pénzügyi nehézséggel, ők több pénzügyi oktatást szeretnének az iskolában,
2025. 12. 15. 08:30
Megosztás:

Erősödött péntek délután óta a forint

Erősödött a forint hétfő reggelre a főbb devizákkal szemben a péntek esti jegyzéséhez képest a nemzetközi devizakereskedelemben.
2025. 12. 15. 08:00
Megosztás:

Karácsonyi gasztroajándékok biztonságosan a Nébih tanácsaival

A Nébih Oktatási Programja a karácsonyi ünnepek közeledtével a házi gasztroajándékok készítésének alapvető tudnivalóit gyűjtötte össze. Az ünnepi időszak közeledtével ugyanis egyre többen választják a személyre szabott, házilag készített gasztroajándékokat: lekvárokat, krémlikőröket, süteményeket vagy éppen ízesített olajokat. A házilag készített finomságok esetében azonban nem elég csak az ízekre és a csomagolásra figyelni, első az élelmiszerbiztonság!
2025. 12. 15. 07:00
Megosztás:

eÁFA: videókkal segít a NAV

Videósorozatot indít a Nemzeti Adó- és Vámhivatal (NAV) annak érdekében, hogy az eÁFA rendszer webes felületének használata még könnyebbé váljon. A rövid videók segítségével az egyre népszerűbb áfabevallási módszert a kisvállalkozások is könnyedén alkalmazhatják. A közérthető videós segédletek gyakran használt funkciókat, vagy épp egy-egy speciálisabb témát mutatnak be. A sorozat indulásaként ma négy kisfilmet tett közzé a NAV, amelyek a hivatal honlapján érhetőek el.
2025. 12. 15. 06:00
Megosztás: