Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

A glass skin trend: a hibátlan bőr titka

Az utóbbi években a szépségipar egyik legnépszerűbb trendje az úgynevezett "glass skin", amely a hibátlan, fénylő bőr megjelenését célozza meg. Ez a trend a Koreából érkező bőrápolási technikákra épül, és az egészséges, mélyen hidratált bőrre helyezi a hangsúlyt, nem pedig a sminkre. Vajon mi a titka annak, hogy bőröd belső ragyogása is idén végre kiteljesedjen?
2026. 01. 24. 21:00
Megosztás:

Hatékony logisztikai megoldások a költözés kihívásaihoz

A költözés gyakran az élet egyik legfeszültebb időszaka lehet, különösen akkor, ha nagy távolságot kell áthidalni vagy sok holmival kell számolnia. A hatékony logisztikai megoldások pedig elengedhetetlenek ahhoz, hogy a folyamat gördülékenyen valósuljon meg. De vajon milyen stratégiákkal készülhet fel a zökkenőmentes költözésre?
2026. 01. 24. 20:00
Megosztás:

Meghosszabbították a Szerbiai Kőolajipari Vállalat működési engedélyét

Február 20-ig meghosszabbította a Szerbiai Kőolajipari Vállalat (NIS) működési engedélyét az Egyesült Államok Pénzügyminisztériumának Külföldi Vagyonellenőrzési Hivatala (OFAC) - közölte a szerb közmédia.
2026. 01. 24. 19:00
Megosztás:

Egy felejthetetlen legénybúcsú receptje

A legénybúcsú egy különleges esemény, amely lezár egy korszakot az életedben, és egy új szakasz kezdetét jelenti. Az alkalom során a barátok egy csapatként összegyűlnek, hogy kellően elbúcsúztassák az agglegényi időket. Egy ilyen program nem egyszerűen egy átlagos szombat esti mulatság – itt minden a szórakozásról, a nevetésről és az emlékek életre keltéséről szól. De mi az, ami egy legénybúcsút igazán különlegessé tesz?
2026. 01. 24. 18:00
Megosztás:

A SEC ejtette a pert a Gemini és a Genesis ellen – teljes befektetői kártalanítás után zárult az ügy

A kriptopiac egyik legnagyobb amerikai jogi ügye ért véget: az Egyesült Államok Értékpapír- és Tőzsdefelügyelete (SEC) hivatalosan is ejtette a Gemini Trust Company és a Genesis Global Capital elleni keresetét. A döntés hátterében az áll, hogy a Gemini Earn program befektetői végül 100%-ban visszakapták kriptoeszközeiket, így az ügy lezárása jogilag és piaci szempontból is fontos mérföldkőnek számít.
2026. 01. 24. 17:00
Megosztás:

Síbiztosítás másképp: mennyibe kerül a védelem a sípályákon

A síszezon minden évben látványosan megmozgatja az utasbiztosítási piacot: az ünnepek előtti hetekben megugranak a kötések, januárban–februárban pedig a téli sportok és a rövidebb külföldi pihenések tartják fenn a keresletet. A K&H adatai szerint 2024-ről 2025-re decemberben 16 százalékkal nőtt, miközben januárban 7 százalékkal, februárban pedig 4 százalékkal csökkent a megkötött utasbiztosítások száma. A trend arra utal, hogy sokan már év végén „előre bebiztosítják” a téli utazást, ugyanakkor az év elején óvatosabbak a döntések – miközben egy káresemény átlagos összege a síszezonban különösen indokolttá teszi a megfelelő fedezet kiválasztását.
2026. 01. 24. 14:00
Megosztás:

Lefelé korrigált a BUX, történelmi csúcson zárt az OTP

A Budapesti Értéktőzsde részvényindexe, a BUX 135,4 pontos, 0,11 százalékos csökkenéssel, 125 061,81 ponton zárt pénteken.
2026. 01. 24. 13:00
Megosztás:

Shiba Inu árfolyam: Erőt mutat a SHIB a hatalmas futures kiáramlás ellenére – merre tovább?

A Shiba Inu (SHIB) ismét a figyelem középpontjába került, miután az árfolyam meglepő stabilitást mutatott annak ellenére, hogy a határidős piacról jelentős tőke áramlott ki. Bár a futures kereskedők óvatosabbá váltak, a token ára mégis több mint 3%-kal emelkedett egyetlen nap alatt. A befektetők most kulcsszinteket figyelnek: vajon újabb kitörés jön, vagy csak átmeneti fellélegzésről van szó?
2026. 01. 24. 12:00
Megosztás:

Az Egyesült Államok kormánya újabb iráni szervezeteket és tartályhajókat érintő szankciókról döntött

Az Egyesült Államok kormánya újabb iráni szervezeteket és tartályhajókat érintő szankciókról döntött a teheráni vezetésre való nyomásgyakorlásként pénteken.
2026. 01. 24. 11:00
Megosztás:

Feladtad már a lottót a hétre? Ha nem, ezt tudnod kell feltétlenül

A top10-es listában van az Ötös- és a Hatoslottó nyereménye is ezen a hétvégén. Mindkét számsorsjátékon több hete halmozódik a nyeremény összege, az Ötös- 3,7, a Hatoslottó 1,9 milliárd forintot kínál a telitalálatra.
2026. 01. 24. 10:00
Megosztás:

Magyarország Európa legjobbja volt a napenergia hasznosításában 2025-ben is

Magyarország tavaly is megőrizte vezető helyét Európában a napelemekkel megtermelt áram részarányában, amely 28 százalékra nőtt 2025-ben - írta az Energiaügyi Minisztérium (EM) parlamenti államtitkára pénteki Facebook-bejegyzésében az Ember nemzetközi energetikai agytröszt elemzésére hivatkozva.
2026. 01. 24. 09:00
Megosztás:

Márciusra készül el a Diósjenő és Balassagyarmat közötti szakasz felújítása

A Vác-Balassagyarmat vasútvonal második, Diósjenő és Balassagyarmat közötti részének "emelt szintű" felújítási munkálatai a kedvezőtlen időjárási viszonyok miatt egy hónapos késéssel zárulhatnak, így március elején indulhat újra a forgalom ezen a szakaszon - tudatta a MÁV-csoport honlapján pénteken.
2026. 01. 24. 08:00
Megosztás:

A Penny átlagosan 8 százalékkal emeli a dolgozók bérét

A Penny az értékesítés és a logisztika területén átlagosan 8 százalékkal, a központi területeken átlagosan 6 százalékkal emeli dolgozói bérét - közölte az áruházlánc pénteken.
2026. 01. 24. 07:00
Megosztás:

Visszakozott a Coinbase: kiszálltak a szenátusi kriptotörvény mögül – mi jöhet ezután?

Meglepetésszerű fordulatot vett a kriptovaluta-szabályozás sorsa az Egyesült Államokban: a Coinbase, az ország vezető kriptotőzsdéje, visszavonta támogatását a Szenátus kriptovaluta-piaci törvényjavaslatától. A „Clarity Act” néven ismert javaslat épp a jogi keretek tisztázását célozta, ám a Coinbase döntése újabb késlekedést és bizonytalanságot hozott a már amúgy is érzékeny szabályozási folyamatba.
2026. 01. 24. 06:00
Megosztás:

Veszélyzónába lépett a Bitcoin árfolyama – Elolvadtak a befektetői nyereségek, mi jöhet ezután?

Bár a Bitcoin árfolyama látszólag nyugalomban van, a blokklánc-adatok mélyebb elemzése egy sokkal feszültebb helyzetet jelez. A befektetői nyereségek rohamos olvadása és a viselkedési minták alapján úgy tűnik, a piac válaszút elé érkezett. Vajon stabilizálódni tud az árfolyam, vagy újabb medvés szakasz következik?
2026. 01. 24. 05:00
Megosztás:

Tőzsdére léphet a Ledger: 4 milliárd dolláros értékelés mellett készülnek New York-i IPO-ra

A kriptovaluták világában egyre erősebb igény mutatkozik a biztonságos tárolási megoldásokra – ezt a trendet lovagolja meg a francia Ledger, amely komoly lépéseket tesz egy amerikai tőzsdei bevezetés felé. A hardveres tárcáiról ismert vállalat értékelése immár meghaladja a 4 milliárd dollárt, és ha minden a tervek szerint halad, 2026 végére akár a New York-i tőzsdén is megjelenhet.
2026. 01. 24. 04:00
Megosztás:

Korlátlan mobilnetet használsz? Akkor jól nézd meg, mert veszteséged lehet rajta!

Egyre többen használnak korlátlan mobilszolgáltatásokat kínáló tarifacsomagot, de az érintett fogyasztók mintegy felének valamilyen fix adatkeretes előfizetés is elég lenne – állapította meg a Nemzeti Média- és Hírközlési Hatóság (NMHH) friss tanulmánya.
2026. 01. 24. 03:01
Megosztás:

Ez fog történni a forintjaiddal, ha Magyarország bevezeti az EURÓ-t

Magyarország EU-tagként jogilag vállalta az euró bevezetését, de jelenleg nincs hivatalos céldátum, és a kormányzati kommunikáció az utóbbi időben inkább elutasító volt. Ezért érdemes úgy nézni a kérdést, mint egy „ha–akkor” forgatókönyvet: ha egyszer megszületik a politikai döntés és teljesülnek a feltételek, akkor a lakosság pénzével nagyjából a következők történnek.
2026. 01. 24. 02:00
Megosztás:

Te is 40 fokon mosod a ruhákat? Jó nagy butaságot csinálsz ezzel!

Sokan úgy gondolják, hogy a 40 °C-os mosás az arany középút: nem túl forró, nem túl hideg, „biztosan tisztít”. Csakhogy a tudományos vizsgálatok szerint ez a hőfok gyakran pont a legrosszabb kompromisszum: nem elég forró a kórokozók elpusztításához, de elég meleg ahhoz, hogy bizonyos baktériumok szaporodjanak, és hosszú távon károkat okozzon a ruhákban és a mosógépben is.
2026. 01. 24. 01:00
Megosztás:

Hány forint lesz egy EURÓ ha a Nemzeti Bank kamatcsökkentésbe kezd?

Januárban erre még kicsi az esély, ugyanakkor az azt követő hónapokban egyre inkább valószínűvé válhat, hogy a Magyar Nemzeti Bank megkezdi a kamatcsökkentési ciklust.
2026. 01. 24. 00:05
Megosztás: