Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

A Hyperliquid 25 dollárra esik, miközben a Digitap ($TAP) a valódi költésekre fókuszál — A legjobb kriptó 2026-ra?

A Hyperliquid eléri a 25 dollárt – gyenge kockázati étvágy a piacon.
2025. 12. 23. 23:00
Megosztás:

A Bitcoin az $88,000-as szinten oldalaz — A Digitap ($TAP) 5-szörös hozamot céloz, mint a legjobb kripto előértékesítési rotációs lehetőség

A Bitcoin árfolyama ezen a héten pontosan ott kezdett, ahol az előző héten abbahagyta: a $88,000 körüli szinten. A köztes időszakban azonban az árfolyammozgás mindennek mondható, csak nyugodtnak nem.
2025. 12. 23. 22:00
Megosztás:

Márciusban indul a legnagyobb keretösszegű földhőpályázat

A kormány a Jedlik Ányos Energetikai Programban minden eddiginél nagyobb forrásmennyiséggel segíti a geotermia térnyerését. A pályázati honlapon keddtől elérhető a földhőre a legtöbb forrást biztosító programelem végleges felhívása, 19 milliárd forint kamatmentes hitel ösztönzi a geotermikus hő- és villamosenergia-termelő beruházásokat Budapesten kívül az ország bármely részében - közölte az Energiaügyi Minisztérium (EM) kedden.
2025. 12. 23. 21:00
Megosztás:

Közelíti a 10%-ot a borravaló mértéke Magyarországon

A bankkártya-használati adatok szerint 2025-ben a magyar fogyasztók 8,12% borravalót adtak a vendéglátó ipari helyeken. A borravaló szokása átalakulóban van a gazdaságban és szektoronként eltérő a mértéke, amit a szezonális hatások is befolyásolnak. A kártyaelfogadási szolgáltató Teya Magyarország először hozott nyilvánosságra a jellemzően vendéglátóipari fogyasztáshoz kapcsolódó, borravalóra irányuló adatokat.
2025. 12. 23. 19:00
Megosztás:

Becsapós lehet az enyhe tél: szakértői tippek a biztonságos ünnepi utazáshoz

Az év végi rokonlátogatások és téli kiruccanások időszaka a magyar közutak egyik legforgalmasabb periódusa. Bár az idei december eddig enyhébb arcát mutatta, a Hankook szakértői arra figyelmeztetnek: a hamis biztonságérzet a legnagyobb ellenség. A változékony időjárás, a „fekete jég” jelensége és a hajnali fagyok olyan kihívások elé állítják az autósokat, amelyekre csak megfelelő műszaki felkészültséggel és minőségi, évszaknak megfelelő abroncsokkal lehet biztonságosan reagálni.
2025. 12. 23. 18:00
Megosztás:

Nőtt a forgalomba helyezett új autók száma az EU-ban

Az Európai Unióban idén novemberben összességében és az év eleje óta is nőtt az új személygépkocsik forgalomba helyezése az egy évvel korábbihoz képest, miközben emelkedett az elektromos járművek piaci részesedése az Európai Autógyártók Szövetsége, az ACEA kedden közzétett jelentése szerint.
2025. 12. 23. 17:00
Megosztás:

Idén a tavalyinál 10 százalékkal több újbor készült

Az idén leszüretelt szőlőből mintegy 2,9-3 millió hektoliter seprős újbor készült, ez 10 százalékkal haladja meg a tavalyi szintet, ami az elmúlt tíz év átlaga körül alakul a Nemzeti Agrárgazdasági Kamara (NAK) és a Hegyközségek Nemzeti Tanácsa által készített körkép szerint.
2025. 12. 23. 16:00
Megosztás:

Új babaáruházlánccal erősít a Mészáros Csoport

Sikeres megállapodást követően adásvételi szerződést írt alá a Mészáros Csoport érdekeltségébe tartozó Talentis Group Zrt. a szlovén ALFI Magántőkealappal és a többi kis tulajdonossal, amelynek értelmében Szlovénia, Horvátország és Észak-Macedónia piacvezető baba-mama és gyermek bolthálózata, a Baby Center a 100 százalékos tulajdonába kerül az Alfi Kids d.o.o-n keresztül - jelentette be a társaság az MTI-nek kedden megküldött közleményben.
2025. 12. 23. 15:00
Megosztás:

Olajos magvak, szaloncukrok, héjas gyümölcsök vizsgálata, karácsonyi vásárok vendéglátóhelyeinek ellenőrzése

A Nemzeti Kereskedelmi és Fogyasztóvédelmi Hatóság (NKFH) és a szakmai irányítása alatt álló kormányhivatalok vendéglátóhelyeket és aszalt gyümölcsöket, olajos magvakat, szaloncukrokat és héjas gyümölcsöket árusító karácsonyi vásárokat, piacokat, vásárcsarnokokat és boltokat ellenőriztek az adventi időszakban. A szaloncukroknál és olajos magvaknál minden tizedik ellenőrzött termék esetében találtak valamilyen hiányosságot, így többek között a termék összetételére és származására vonatkozó tájékoztatási, valamint nyomonkövetési problémák merültek fel. Eközben a karácsonyi vásárok vendéglátóhelyeit is vizsgálta a hatóság, amelyek közül 6 egység ideiglenes bezárására vagy a tevékenység korlátozására került sor higiéniai problémák miatt.
2025. 12. 23. 14:00
Megosztás:

A 4iG Nyrt. új finanszírozási feltételei tovább erősítik a csoport hosszú távú növekedési terveit

A 4iG megállapodást kötött az NKP II. keretében kibocsátott kötvényeinek új feltételrendszeréről, amely a finanszírozók részéről a társaság eredményes növekedési pályájának és megerősödött pénzügyi teljesítményének elismerését, valamint a befektetők hosszú távú bizalmát tükrözi. A lépéssel felszabaduló jelentős forrásokat a vállalatcsoport a következő években a hazai és nemzetközi növekedési stratégiájának prioritásaira – az űr- és védelmi ipari, valamint a távközlési és digitális infrastruktúra területén tervezett beruházásokra, valamint célzott akvizíciókra – fordíthatja, amely a részvényesi értékteremtést szolgálja.
2025. 12. 23. 13:00
Megosztás:

Milliárdos veszteség is lehet a vége: a gyártás legsérülékenyebb pontja

2025-ben a gyártóvállalatok digitalizációja és automatizációja új, korábban nem látott kiberfenyegetéseket hozott magával. A támadási pontok száma a termelési rendszerek összekapcsoltsága miatt többszörösére nőtt, miközben számos ipari szereplő még mindig alábecsüli a kockázatokat. Az OMIKRON Informatika Kft. friss tapasztalatai szerint nemcsak az IT-rendszerek, hanem az üzemi OT-környezet sérülékenysége is komoly üzletmeneti kockázatot jelent: egyetlen támadás akár teljes gyárleállást is okozhat.
2025. 12. 23. 12:00
Megosztás:

Karácsonykor is nyitva tartanak az ORLEN DESPAR üzletei

Az ORLEN Hungary országszerte már 70 töltőállomáson üzemeltet DESPAR élelmiszerüzleteket, ahol a tankolás mellett a mindennapi bevásárlás egyaránt gyorsan és kényelmesen elintézhető. Az ORLEN benzinkutakon található DESPAR egységek az ünnepi időszakban is megbízható megoldást nyújtanak azok számára, akik az utolsó pillanatban szembesülnek azzal, hogy hiányzik egy-egy fontos alapanyag a karácsonyi készülődéshez.
2025. 12. 23. 11:00
Megosztás:

A virtuális rendezvények és koncertek új korszaka

Abban a korszakban, amikor a világ a világjárvány idején a túlélésért küzdött, és az emberek nem tudtak elmenni kedvenc koncertjeikre, a szórakoztatóipar megszűnt kizárólag offline formában létezni.
2025. 12. 23. 10:44
Megosztás:

Vállalkozók! Ezek a változások jönnek 2026-ban

Fontos adóváltozások lépnek életbe 2026. január 1-jétől. Emelkedik az alanyi adómentes (AAM) határ, módosul az átalányadózás egyik kulcseleme, a költséghányad, továbbá átalakul a szociális hozzájárulási adó (SZOCHO) minimum alapjának meghatározása is. A módosítások egyszerre jelenthetnek könnyebbséget és új, odafigyelést igénylő feladatokat a vállalkozók számára.
2025. 12. 23. 09:00
Megosztás:

Botrány az Aave-nél: egy elhamarkodott szavazás megrendíti a DeFi egyik zászlóshajóját

Az Aave, a decentralizált pénzügyek (DeFi) egyik legismertebb protokollja, ezúttal nem technikai újításaival vagy hozamígéreteivel, hanem belső kormányzási válságával került a figyelem középpontjába. Egy vitatott szavazási kezdeményezés, mely a protokoll márkaeszközeinek DAO alá helyezéséről szól, komoly feszültséget váltott ki a közösségben – és súlyos kérdéseket vet fel a decentralizáció hitelességével kapcsolatban.
2025. 12. 23. 08:00
Megosztás:

Miközben az USA és az EU elad, Ázsia csendben felvásárolja a Bitcoint – íme, miért

A Bitcoin piaca látszólag kiszámíthatatlan – napközben gyengül, éjszaka stabilizálódik vagy enyhén erősödik. Mi állhat ennek a furcsa viselkedésnek a hátterében? A válasz egyszerűbb, mint gondolnánk: időzónák és földrajzi különbségek. Míg az Egyesült Államokban és Európában inkább eladnak, addig Ázsiában egyre többen vásárolnak. A globális kereskedési adatok alapján egyértelmű a trend – és talán a jövő is.
2025. 12. 23. 07:00
Megosztás:

Bitcoin bálnák eladják vagyonuk egy részét – 3,37 milliárd dollárnyi BTC mozdult meg decemberben

2025 decemberében látványos mozgások zajlottak a Bitcoin piacon: a legnagyobb kriptotartók – az úgynevezett „bálnák” – több mint 36 000 BTC-t dobtak piacra. Ez a több milliárd dollár értékű eladás komoly kérdéseket vet fel a Bitcoin árfolyamának rövid távú jövőjét illetően, különösen egy ilyen ingadozó piaci időszakban.
2025. 12. 23. 06:00
Megosztás:

Meglepő fordulat: A JPMorgan kriptokereskedést tervez intézményi ügyfeleknek

A Wall Street egyik legnagyobb neve, a JPMorgan Chase, újabb jeleit mutatja annak, hogy a kriptoipar végleg belépett a pénzügyi fősodorba. Bár korábban még élesen kritizálta a Bitcoint, a bank most komolyan mérlegeli a kriptokereskedés bevezetését – igaz, egyelőre csak az intézményi ügyfelek számára.
2025. 12. 23. 05:00
Megosztás:

Az EU újabb fél évvel meghosszabbította az Oroszország elleni gazdasági szankciókat

Az uniós tagállami kormányokat tömörítő Tanács hétfőn további hat hónappal, 2026. július 31-ig meghosszabbította az Oroszország elleni gazdasági szankciókat az Ukrajna elleni agresszió miatt.
2025. 12. 23. 04:00
Megosztás:

Újból szükség van az ország összefogására Sági Dominik megmentésért

A kisfiú egy ritka, halálos lefolyású genetikai betegségben, gyermekkori izomsorvadásban szenved, melynek gyógyítása 1,3 milliárd forintba kerül. Az ügynek új lökést adhat, hogy felajánlottak egy, a magyar fociválogatott által dedikált labdát.
2025. 12. 23. 03:00
Megosztás: