Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Korábbi Ripple CTO: Esélytelen a Lopott XRP Visszaszerzése – Itt a Kemény Valóság

Hiába reménykedtek a károsultak: a lopott XRP nem szerezhető vissza az XRP Ledgeren. David Schwartz, a Ripple korábbi technológiai igazgatója egyértelművé tette, hogy az úgynevezett „Clawback” funkció nem alkalmazható az XRP tokenre. A friss biztonsági incidens ismét rávilágított a decentralizált blokklánc-hálózatok egyik legfontosabb – és sokak számára fájdalmas – sajátosságára: a tranzakciók véglegességére.
2026. 02. 14. 16:00
Megosztás:

A fedőmatracról alkotott tévhitek és valóság

Eszedbe jutott már valaha, miért akad annyi félreértés a fedőmatracok körül? Gyakori, hogy az emberek valamilyen csodaszerként tekintenek ezekre az alvássegítőkre, mások pedig teljesen feleslegesnek tartják őket. A valóság azonban – mint oly sok esetben – valahol középen van.
2026. 02. 14. 15:00
Megosztás:

Csillagászati összegek az Ötös – és Hatoslottón

Halmozódik a főnyeremény összege Magyarország két legismertebb lottójátékán. Az Ötöslottón 132 a Hatoslottón 100 napja nem volt telitalálatos szelvény. Előbbi 4,56 milliárd forinttal kecsegtet, utóbbin 2,464 milliárd forint várja a játékosokat.
2026. 02. 14. 14:00
Megosztás:

Hogyan határozza meg a RAM a számítógép teljesítményét?

A számítógéped működése során számos elem meghatározza, milyen gyorsan és hatékonyan teljesítik az egyes feladatokat. Az egyik legfontosabb tényező, amely közvetlenül hat a rendszer gyorsaságára, az a RAM. Lehet, hogy már tapasztaltad, mennyire számít, hogy 4, 8 vagy akár 16 GB RAM-mal szerelt gépet használsz. Naponta érzed, hogy a memória nagymértékben befolyásolja, milyen élményt nyújt a számítógéped. Nézzük meg, miért olyan fontos a RAM!
2026. 02. 14. 13:00
Megosztás:

Műcsalik: az új generáció kedvencei a pergető horgászatban

A horgászat során egyre nagyobb teret nyernek az innovatív ötletek, ahogy a hagyományos csalikat a fejlett technológiával készült műcsalik váltják fel. Korábban a természetes csalik voltak népszerűek, de a modern műcsalik az elmúlt években teljesen meggyőzték a pergetőhorgászok közösségét. Miért is olyan kedveltek ezek a korszerű csalik? És vajon te is közéjük tartozol?
2026. 02. 14. 12:00
Megosztás:

Így költekezünk a Valentin-nap környéken

A Valentin-nap az ajándékozás és a figyelmesség jegyében telik, ami a bankkártyás forgalmi adatokban is markánsan megmutatkozik. A K&H megvizsgálta az ügyfelek költési szokásait február első két hetében: az adatokból kiderül, hogy a forgalom egy év alatt 18 százalékkal bővült, így már 100 milliárd forint felett költünk ebben az időszakban. Bár a számla évről évre magasabb, az egy vásárlásra jutó átlagos összeg emelkedése mellett a vásárlási arányok meglepően stabilak maradnak.
2026. 02. 14. 11:00
Megosztás:

Tömítés a ház körül: mire érdemes figyelni?

Otthon mindenki találkozik repedésekkel, hézagokkal, amelyeket hajlamosak vagyunk figyelmen kívül hagyni, míg egyszer valódi problémává nem válnak. Pedig a tömítés nem pusztán esztétikai szempontból fontos; az anyagok helyes megválasztása kulcsfontosságú a tartósság érdekében.
2026. 02. 14. 10:00
Megosztás:

NAK: tiltakoznak a V4+ agrárkamarái az Európai Bizottság tervei ellen

Határozott irányváltást követel az Európai Bizottságtól a cseh, a lengyel, a magyar, a szlovák, valamint a lett és a litván agrárkamara - közölte a Nemzeti Agrárgazdasági Kamara (NAK) pénteken az MTI-vel.
2026. 02. 14. 09:00
Megosztás:

Venezuelai kőolaj kitermelésére adott ki engedélyt az Egyesült Államok nemzetközi olajipari vállalatoknak

Venezuelai kőolaj és földgáz kitermelésére adott ki engedélyt az Egyesült Államok kormánya több nagy nemzetközi olajvállalatnak pénteken.
2026. 02. 14. 08:00
Megosztás:

Hatalmas lökést adott az Otthon Start az újlakás-piacnak

Az Otthon Start program teljesen új dinamikát alakított ki a lakáspiacon: Miközben a vevői oldalon olcsó és kiszámítható finanszírozást teremtett, az eladók számára szigorú ár- és négyzetméterár-korlátokat érvényesít. A hiteligények száma napjainkban már meghaladja a 15 ezret, ám ezzel párhuzamosan a kínálati oldal is kezd felzárkózni: az országszerte elindított 12 nemzetgazdasági kiemeléssel rendelkező újlakás-beruházásban eddig már 6000 felett jár a bejelentett épülő lakások száma. A következő években várható átadási hullám és az árplafon egyszerre fékezheti a fővárosi drágulást és enged teret vidéken az áremelkedésnek.
2026. 02. 14. 07:00
Megosztás:

Az Egyesült Államok megszünteti a jemeni állampolgárok átmeneti védelmét

Az Egyesült Államok megszünteti az országban tartózkodó jemeni állampolgárok átmeneti védelmet - jelentette be pénteken Kristi Noem belbiztonsági miniszter.
2026. 02. 14. 06:00
Megosztás:

Továbbra is a fiatalok és az első lakásvásárlók az ingatlanpiac főszereplői

A Duna House legfrissebb adatai szerint 2026 elején is kitart a tavalyi év második felében felerősödött trend, a piacon továbbra is a fiatal, első lakásukat keresők dominálnak, miközben a befektetési céllal vásárlók aktivitása még nem tért vissza a korábbi szintekre.
2026. 02. 14. 04:00
Megosztás:

Továbbra is a fiatalok és az első lakásvásárlók az ngatlanpiac főszereplői

A Duna House legfrissebb adatai szerint 2026 elején is kitart a tavalyi év második felében felerősödött trend: a piacon továbbra is a fiatal, első lakásukat keresők dominálnak, miközben a befektetés céllal vásárlók aktivitása még nem tért vissza a korábbi szintekre.
2026. 02. 14. 03:00
Megosztás:

Ennyi lesz a nyugdíjad, ha minimálbéren vagy bejelentve!

Sokan gondolják úgy, hogy a 40 év munkaviszony önmagában garancia a tisztességes nyugdíjra. A valóság azonban jóval árnyaltabb – különösen akkor, ha valaki egész életében minimálbérre volt bejelentve. Ebben az összefoglalóban lépésről lépésre, közérthetően mutatjuk meg, hogyan számítható ki egy ilyen életpálya nyugdíja, és mire lehet reálisan számítani 2026-ban, a hatályos magyar jogszabályok alapján.
2026. 02. 14. 02:00
Megosztás:

Téli villanyszámla-meglepetés: 30% kedvezmény járhat, ha időben lépsz

A januári rendkívüli hideg sok háztartásnál brutálisan megdobta a fűtési költségeket. A családok terheinek enyhítésére rezsistop lépett életbe, amelynek keretében azok is komoly könnyítést kaphatnak, akik villamos energiával fűtenek. A lehetőség azonban nem automatikus: egy fontos nyilatkozatról van szó, amelynek elmulasztása a kedvezmény elvesztését jelenti.
2026. 02. 14. 01:00
Megosztás:

Idén már közel 70 ezren kérték az anyakedvezményeket online a NAV-nál

Brüsszel és magyarországi lerakata adót emelne és a családok helyett a multikat, Ukrajnát és a háborút támogatná. A Tiszával ellentétben a kormány azon dolgozik, hogy egyre több pénz maradjon a családok zsebében, ezért Európa legnagyobb adócsökkentési programját hajtja végre: tavaly júliustól adómentes lett a CSED, a GYED és az örökbefogadói díj, 2025 októberétől a háromgyermekes anyák, 2026 januárjától a 30 év alatti anyák, valamint a 40 év alatti kétgyermekes anyák teljes szja-mentességben részesülnek. Mindezek mellett a kormány 2026-ra kétlépcsőben megduplázta a családi adókedvezményt is, mert Magyarország forrásainak nem Ukrajnában, hanem a magyar embereknél van a helye.
2026. 02. 14. 00:05
Megosztás:

Intenzív csaláshullámra figyelmeztet az Internet Hotline

Az elmúlt két hónapban mintegy százötven bejelentés érkezett az MVM Next és a NAV nevével visszaélő weboldalakról a Nemzeti Média- és Hírközlési Hatóság (NMHH) online jogsegélyszolgálatához. A csalók SMS- és e-mail üzenetekben hivatalosnak látszó weboldalakra próbálják irányítani a címzetteket, hogy így szerezzék meg bankkártyaadataikat. Az Internet Hotline szakértői hangsúlyozzák: a szolgáltatók és a hatóságok valós megkeresései soha nem tartalmaznak fizetési oldalra vezető linkeket.
2026. 02. 13. 23:00
Megosztás:

Magyarországon 13,9%-kal nőtt a biotermékek kiskereskedelmi forgalma – hazánk az Európai Unióban a második leggyorsabban bővülő piac

Megjelentek a legfrissebb statisztikai adatok az ökológiai gazdálkodás globális trendjeiről. A legújabb, 2024-es adatokat a „The World of Organic Agriculture” statisztikai évkönyv összegzi, amelyet a szerzők hagyományosan a világ vezető bioélelmiszeripari vásárán és konferenciáján, a németországi BIOFACH-on mutattak be. Az idei vásár kiemelten foglalkozott a fiatal földművelő generáció szerepvállalásával az ökoágazatban és számtalan szekció vizsgálta a biotermékek kereskedelmi trendjeit, valamint a teljes értékláncban rejlő fejlesztési lehetőségeket. A bioélelmiszerek forgalma világszerte 3,5%-kal, Európában 4,1%-kal növekedett 2023-ról 2024-re. E termékek hazánkban is egyre népszerűbbek: az évkönyv tanulsága szerint a kiskereskedelmi forgalomemelkedést tekintve Magyarország 13,9%-os növekedéssel második helyre került az Európai Unióban, közvetlenül Luxemburg (20,2%) után.
2026. 02. 13. 22:00
Megosztás:

Az téli időjárás miatt 60 százalékkal csökkent a határátlépések száma januárban az EU-ban

A téli hideg, a jeges viharok és a háborgó tenger a főbb migrációs útvonalakon hozzájárult az Európai Unióba irányuló illegális határátlépések csökkenéséhez, az előző év azonos hónapjához képest januárban 60 százalékkal kevesebben, mintegy 5500-an próbáltak átjutni az EU külső határain - tájékoztatott az EU határ- és partvédelmi ügynöksége, a Frontex pénteken.
2026. 02. 13. 20:00
Megosztás:

Jelentős túljegyzéssel zárta a tavaly indított 100 millió eurós kötvényprogramját a WING

Az utolsó, még lejegyezhető, 34,8 millió euró névértékű kötvénycsomagra 57,64 millió euró összértékű vételi ajánlat érkezett, 6%-os fix kamatozás mellett. Ezzel a WING, Közép-Európa ingatlanpiacának egyik vezető szereplője tovább erősítette tőkepiaci jelenlétét és kezdeményezte a WINGHOLDING 2029/I kötvény bevezetését a Budapesti Értéktőzsdére.
2026. 02. 13. 19:00
Megosztás: