Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Így csap le Európa gazdaságára a közel-keleti háború

Az Európai Központi Bank a várakozásunknak és a széleskörű piaci várakozásoknak is megfelelően újfent 2,00%-on hagyta a betéti rátát. Az aktív oldali rendelkezésre állás kamatlába 2,40%-on, az irányadó refinanszírozási műveletek kamatlába pedig 2,15%-on maradt.
2026. 03. 20. 04:00
Megosztás:

Miért nem érdemes tiltani a munkavállalók másodállását?

Önmegvalósítás vagy anyagi kényszer? A WHC Csoport elemzése szerint a főállás mellett vállalt másodprojektek térnyerése már olyan jelentős hazánkban, hogy komoly munkajogi, adózási és bérszámfejtési kihívást jelenthet a vállalatok számára. A szakértők hangsúlyozzák: a tiltás helyett a transzparens szabályozás és a támogató vállalati kultúra a kulcs a lojalitás megőrzéséhez, hiszen a több lábon álló munkavállalók új kompetenciákat is hozhatnak a szervezetbe, ugyanakkor a munkáltatóknak kiemelt figyelmet kell fordítaniuk az összeférhetetlenségi kérdésekre és a pihenőidő betartására a hatékony működés érdekében.
2026. 03. 20. 03:30
Megosztás:

Meglepő tények a csapvízről a víz világnapján

Amikor megnyitjuk a csapot, egy több tízezer kilométeres vezetékhálózat és összetett tisztítási folyamat eredménye jut el a poharunkba. A víz világnapja alkalmából a szakemberek arra hívják fel a figyelmet, hogy az ivóvíz nem magától értetődő erőforrás, hanem egy folyamatosan karbantartott rendszer eredménye. Magyarországon a közel százezer kilométeres vízhálózat jelentős része már több mint ötvenéves. A szakértők szerint ezért a vízbiztonság egyik kulcskérdése ma az infrastruktúra állapota és a szakszerű kivitelezés.
2026. 03. 20. 03:00
Megosztás:

A Fidesz EP-képviselői írásbeli kérdéssel fordulnak az Európai Bizottsághoz a magyarországi Facebook-cenzúra ügyében

A Fidesz európai parlamenti (EP-) képviselői írásbeli kérdéssel fordulnak az Európai Bizottsághoz a magyarországi Facebook-cenzúra ügyében azt követően, hogy a brüsszeli testület bejelentette: élesíti a magyar választásokra az úgynevezett gyorsreagálású rendszert, ami bizonyos közösségi média tartalmak megjelölésére ad lehetőséget, hogy korlátozzák azok elérését - tájékoztatott a Fidesz uniós parlamenti képviselőcsoportja csütörtökön.
2026. 03. 20. 02:30
Megosztás:

Brutális döntés előtt a nyugdíjrendszer: jön a Férfiak40, vagy mindent átalakítanak?

Évek óta visszatérő kérdés, ami újra és újra felkorbácsolja a kedélyeket: bevezessék-e a férfiak kedvezményes nyugdíját („Férfiak40”), vagy inkább teljesen új alapokra kellene helyezni a rendszert? A válasz azonban korántsem egyszerű – sőt, komoly gazdasági és társadalmi következményei lehetnek.
2026. 03. 20. 02:00
Megosztás:

16 éves kor alatt tilos lesz a TikTok, a Facebook és a SnapChat használata is

Egy egész generáció mindennapjai kerülhetnek gyökeres változás elé – egy döntés, amely sokak szerint régóta esedékes volt, mások szerint viszont túl messzire megy.
2026. 03. 20. 01:00
Megosztás:

Máárcius 21-étől érkeznek a "rezsistopkedvezményt" tartalmazó számlák

Március 21-étől érkeznek a "rezsistopkedvezményt" tartalmazó számlák - közölte az MVM Facebook-oldalán csütörtökön.
2026. 03. 20. 00:30
Megosztás:

Több tízezer termelőhöz érkezik a napokban agrártámogatás

Több tízezer termelőhöz érkezik a napokban agrártámogatás, gyorsuló kifizetésekkel segíti az Agrárminisztérium a gazdálkodókat - közölte az Agrárminisztérium (AM) az MTI-vel csütörtökön.
2026. 03. 20. 00:05
Megosztás:

A Mol 300 forint körüli osztalékot fizethet részvényenként

A Mol igazgatósága részvényenként 180 forint alaposztalék és 120 forint körüli rendkívüli osztalék, így együttesen körülbelül 300 forint részvényenkénti osztalék fizetését javasolja a közgyűlésnek, ami 9,1 százalékkal haladja meg a tavalyit - közölte a Mol Nyrt. a Budapesti Értéktőzsde (BÉT) honlapján csütörtökön.
2026. 03. 19. 23:30
Megosztás:

Ezekkel a számokkal nyerhettél a hatos lottón!

A Szerencsejáték Zrt. tájékoztatása szerint a 12. héten megtartott hatos lottó számsorsoláson a következő számokat húzták ki:
2026. 03. 19. 23:00
Megosztás:

A magyarok kedvence a szénsavmentes másfél literes ásványvíz

Ötödével több ásványvizet vásároltak a magyarok a Kifli.hu-n az elmúlt egy évben, a másfél literes és a szénsavmentes változatok a legnépszerűbbek. A régiós összehasonlításban Magyarország a harmadik helyen áll, a magyarok jóval több ásványvizet rendelnek, mint a csehek vagy az osztrákok.
2026. 03. 19. 22:30
Megosztás:

Már csak két hét maradt a lakásbiztosítási kampányból: az igazi hajrá csak most kezdődhet

Kitartott az első hét lendülete a lakásbiztosítási kampány második hetében is, a kalkulációk száma és a szerződéskötések száma is ugyanazon a szinten mozgott, mint március elején. Ugyanakkor már csak két hét maradt hátra a kampányból, és a korábbi évek adatai azt mutatják, hogy sokan az utolsó pillanatra hagyják a váltást, így könnyen lehet, hogy március második fele az idei évben is jelentős felfutást hozhat – írja a Bank360.
2026. 03. 19. 22:00
Megosztás:

Túlterheltek és időhiányban szenvednek a magyar női vállalkozók és vezetők

Túlterheltek és időhiányban szenvednek a magyar női vállalkozók és vezető beosztásban dolgozó nők, akik közül leginkább a 30-39 évesek érzik magukat hajszoltnak, miközben a válaszadók többsége elégedett a jövedelmével - közölte reprezentatív felmérése alapján a Számlázz.hu csütörtökön az MTI-vel.
2026. 03. 19. 21:30
Megosztás:

Erősödött a forint csütörtök estére

Erősödött a forint a főbb devizákkal szemben csütörtök kora estére a bankközi devizapiacon reggelhez képest.
2026. 03. 19. 21:00
Megosztás:

Jelentős közlekedésfejlesztési projekt indul Zalaegerszegen

Több mint másfél milliárd forint állami támogatással turbókörforgalmat alakítanak ki Zalaegerszeg keleti kapujában, a város egyik legforgalmasabb kereszteződésében - közölte csütörtöki sajtótájékoztatóján a város polgármestere.
2026. 03. 19. 20:30
Megosztás:

Hetekig elhúzódó harcokra számítanak Izraelben

Az izraeli hadsereg helyzetértékelése szerint még több hétig eltarthat az Irán és a Hezbollah elleni háború.
2026. 03. 19. 20:00
Megosztás:

Online is köthető növénybiztosítás az MBH AgrárPartner Platformon

Az MBH Bank 100 százalékos tulajdonában álló leányvállalata, az MBH eFin Technologies Zrt. és a Hungarikum Biztosítási Alkusz Zrt. elindította az MBH AgrárPartner Platformot, amelyen növénybiztosítást köthetnek a gazdálkodók - közölte az MBH Bank csütörtökön az MTI-vel.
2026. 03. 19. 19:30
Megosztás:

A VisitBalaton365 csütörtökön indult kampányában a Balaton tavaszi élményeire hívja fel a figyelmet

A Balaton tavaszi élményeire hívja fel a figyelmet a VisitBalaton365 csütörtökön indult kampánya, amelynek a célja, hogy a Balaton tavasszal is erős belföldi úti célként jelenjen meg. A fókusz a rövid, élményalapú utazások ösztönzésén, az aktív programok, valamint a bor- és gasztronómiai kínálat láthatóvá tételén, továbbá a digitális kampányeszközökkel támogatott forgalomélénkítésen van - közölte a VisitBalaton365 Nkft. csütörtökön az MTI-vel.
2026. 03. 19. 19:00
Megosztás:

Az EKB változatlanul hagyta az irányadó kamatlábakat

Az Európai Központi Bank (EKB) Kormányzótanácsa csütörtöki ülésén a piaci várakozásokkal összhangban nem változtatott a három irányadó eurókamat szintjén.
2026. 03. 19. 18:30
Megosztás:

A vendégek 73%-a nem tér vissza, ha nem tetszik neki a mosdó – mit tehetnek az éttermek?

A vendéglátóipar két megkerülhetetlen kihívással néz szembe: a vendégek higiéniai elvárásai sosem voltak magasabbak, miközben a fenntarthatósági nyomás is folyamatosan nő az éttermeken, szállodákon. A Tork kutatása szerint a vendégek közel háromnegyede nem tér vissza oda, ahol negatív tapasztalata volt a mosdóval, és eközben egyre környezettudatosabbak is. A válasz mindkét kihívásra a megfelelő higiéniai megoldások alkalmazása lehet, amelyekkel csökkenthető a pazarlás.
2026. 03. 19. 18:00
Megosztás: