Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

A tehéntartók panasza eljutott a kormányhoz

A piaci nehézségek közepette felértékelődik a tudatos vásárlás, a tejtermelés túlélése múlhat most azon, hogy minél többen válasszák a magyar tejtermékeket - mondta szerdai videóüzenetében az agrárminiszter.
2026. 03. 12. 03:30
Megosztás:

Friss kutatás: Évi 7 millió forinttal is többet kereshetnek a diplomások

A Varsovia Egyetem 2026-os kutatása szerint Magyarországon az érettségizett átlagkeresethez képest egy alapdiploma (BA/BSc) átlagosan nagyjából 200.000 forintos (40 százalékos), egy mesterdiploma (MA/MSc) pedig már 450.000 forintos (közel 97 százalékos) kereseti előnyt jelenthet. A számítások alapján ez éves szinten – a végzettségi szinttől függően – megközelítőleg 2,8-6,8 millió forintos bérkülönbséget is jelenthet. Noll-Batek Frigyes, a Varsovia Üzleti és Alkalmazott Tudományok Egyetemének prorektora azt mondta: egy önköltséges alapképzés ára akár alig több mint egy év alatt visszahozható, mesterszinten pedig ennél is gyorsabban megtérülhet. A felmérés szerint a felsőfokú végzettség a bérek mellett a karrierlehetőségekre és a rugalmas munkavégzés esélyére is hatással van.
2026. 03. 12. 03:00
Megosztás:

Újabb csapás Európának: az energiaválság miatt zuhannak a tőzsdék

Az európai részvénypiacok jelentős eséssel indították a hetet, miután az Irán körüli konfliktus eszkalációja megemelte az olajárakat, és erős kockázatkerülő hangulat alakult ki a piacon. A STOXX 600 index akár 2%-os esést is mutat, tovább növelve a múlt heti 5,51%-os visszaesést, így az index már közel 7,3%-kal áll a februári rekordértéke alatt. A főbb indexek – köztük a DE40, FRA40, UK100 és SPA35 – 1,5–2,5% közötti mínuszban vannak. A VSTOXX volatilitási index közel 4%-kal emelkedett, 30,30 pontra, ami április óta a legmagasabb szint. A jelenlegi helyzetet a Magyarországon is jelen lévő globális befektetési alkalmazás, az XTB szakértői elemezték.
2026. 03. 12. 02:30
Megosztás:

Vasárnapi boltzár - zárva lesz a Penny, az ALDI és a LIDL is

Március 15. minden esztendőben különleges jelentőséggel bír Magyarországon, hiszen az 1848–49-es forradalom és szabadságharc emléknapja. Ilyenkor az ország számos pontján tartanak ünnepi rendezvényeket, megemlékezéseket és programokat, sok család pedig kirándulással vagy közös kikapcsolódással tölti az időt. 2026-ban azonban egy apró eltérés lesz a megszokott rendhez képest: a nemzeti ünnep vasárnapra esik, így most nem alakul ki hosszú hétvége. De mely boltok lesznek zárva és esetleg nyitva?
2026. 03. 12. 02:00
Megosztás:

Ezüst árfolyam elemzés - meddig ragyoghat még?

Noha január végén történelmi nagyságrendű zuhanást lehetett látni az ezüst árfolyamában, a nemesfém piaca 2026-ban az egyik legizgalmasabb nyersanyag-befektetési területté válhat: az ipari felhasználás rekordokat dönt, miközben a kínálat továbbra is képtelen lépést tartani. A tartós fizikai hiány, a zöldtechnológiai boom és a geopolitikai bizonytalanság egyszerre hajtja fel az árfolyamot. Az MBH Befektetési Bank szakértője az arany után az ezüst piaci kilátásait is értékelte.
2026. 03. 12. 01:30
Megosztás:

Érdemes a lottón minden héten ugyanazokkal a fix számokkal játszani?

Sokan hisznek abban, hogy ha évekig ugyanazokat a számokat játsszák meg, előbb-utóbb biztosan „beüt a szerencse”. Mások viszont minden héten új számokat választanak, mert úgy érzik, így nagyobb az esélyük a nyerésre. De vajon matematikailag tényleg számít, hogy mindig ugyanazokat a számokat játsszuk, vagy hetente változtatjuk őket?
2026. 03. 12. 01:00
Megosztás:

Kijev: nincs hivatalos státusza a Barátság vezetéket vizsgáló magyar csoportnak

Ukrajna területén nincs hivatalos státusza vagy tervezett hivatalos találkozója a Barátság kőolajvezeték állapotának vizsgálatára Magyarországról érkezett csoportnak, ezért helytelen őket "küldöttségnek" nevezni - jelentette ki Heorhij Tihij ukrán külügyi szóvivő szerdán újságíróknak.
2026. 03. 12. 00:30
Megosztás:

Spanyolország eszközt vezet be az online gyűlöletbeszéd figyelésére

A közösségi médiában megjelenő gyűlöletbeszéd nyomon követésére és mérésére alkalmas eszköz bevezetését jelentette be a spanyol miniszterelnök szerdán Madridban, az első Gyűlölet Elleni Fórumon tartott megnyitóbeszédében.
2026. 03. 12. 00:05
Megosztás:

Már csak pár napig lehet kérni az szja-bevallási tervezetek postázását

Még öt napig, március 16-ig kérhetik az szja-bevallási tervezetek postázását azok, akik nem rendelkeznek elektronikus elérhetőséggel - hívta fel a figyelmet szerdán a Nemzeti Adó- és Vámhivatal (NAV).
2026. 03. 11. 23:30
Megosztás:

A Leadec Kft. európai szolgáltatóközpontot hozott létre Győrben

A Leadec Kft. európai szolgáltatóközpontot hozott létre Győrben, amelynek nyomán hatvan új, magas képzettséget igénylő munkahely jön létre - közölte Szijjártó Péter külgazdasági és külügyminiszter szerdán a városban.
2026. 03. 11. 23:00
Megosztás:

Lengyelországban nyomozás indult az Epstein-akták ügyében

Az Epstein-akták elemzése alapján Lengyelországban nyomozás indult feltételezett emberkereskedelem ügyében, az eljárás során két másik európai országhoz fordultak kölcsönös jogsegély keretében - közölte szerdán a lengyel államügyészség.
2026. 03. 11. 22:30
Megosztás:

Franciaország eddig 20 ezer állampolgárát utaztatta haza

Franciaország mintegy 20 ezer állampolgárát utaztatta haza a február 28-án megindított iráni háború kezdete óta a közel-keleti régióból - közölte szerdán Maud Bregeon kormányszóvivő.
2026. 03. 11. 22:00
Megosztás:

Felfüggesztik a március 8-tól tartó sztrájkot a pécsi buszvállalatnál

Csütörtöktől felfüggeszti a március 8-tól érvényben lévő sztrájkmenetrendet a pécsi közösségi közlekedési feladatokat ellátó Tüke Busz Zrt. - közölte a társaság szerdán az MTI-vel. A társaság mellett működő Szolidaritás Autóbusz-közlekedési Szakszervezet (Szaksz) elnöke az érdekképviselet közösségi oldalán azt írta, hogy értesülései szerint a Tüke Busz Zrt. vezérigazgatója folytathatja a bértárgyalást.
2026. 03. 11. 21:30
Megosztás:

Ideiglenes üzemanyaghiány jelent meg egyes szlovén kutakon

A kereslet hirtelen növekedése miatt egyes Petrol-töltőállomásokon átmeneti üzemanyaghiány alakult ki Szlovéniában, de a közelben található kutaknál általában továbbra is elérhető az üzemanyag - közölte szerdán a Petrol szlovén olajipari vállalat.
2026. 03. 11. 21:00
Megosztás:

Fennállásának 130. évfordulóját ünnepli a Szellemi Tulajdon Nemzeti Hivatala

Fennállásának 130. évfordulóját ünnepli a Szellemi Tulajdon Nemzeti Hivatala (SZTNH), a jubileum kapcsán megtartott, jelentős nemzetközi jelenléttel lezajlott ünnepi esemény középpontjában Magyarország egyik legrégebbi, folyamatosan működő állami intézményének története, valamint a jövő technológiai és egyéb kihívásai álltak - közölte az SZTNH szerdán az MTI-vel.
2026. 03. 11. 20:30
Megosztás:

Csalók élnek vissza a Nemzeti Egészségbiztosítási Alapkezelő nevével

Adathalász sms-ekben próbálnak adatokat kicsalni ismeretlenek a Nemzeti Egészségbiztosítási Alapkezelőre (NEAK) hivatkozva - hívta fel a figyelmet a szervezet az MTI-nek szerdán küldött közleményében.
2026. 03. 11. 20:00
Megosztás:

Jövő héten indul a munkakörülmények fejlesztését célzó pályázat második szakasza

A Gazdaságfejlesztési és Innovációs Operatív Program Plusz keretében megvalósításra kerülő GINOP_PLUSZ-3.2.5-24-2024-00001 "Munkakörülmények fejlesztése" elnevezésű kiemelt projektre fordítandó 8,610 milliárd forint összegű vissza nem térítendő támogatást társfinanszírozás keretében az Európai Szociális Alap+, valamint Magyarország költségvetése biztosítja. A második szakaszban, március 16-ától további mintegy 1,857 milliárd forintnyi vissza nem térítendő támogatás válik elérhetővé mikro-, kis- és középvállalkozások számára - tájékoztatott szerdai közleményében a Nemzetgazdasági Minisztérium (NGM).
2026. 03. 11. 19:30
Megosztás:

Megelőzheti valaha a Zcash a Bitcoint?

A kriptovaluták világában időről időre felmerül a kérdés: vajon létezhet-e olyan digitális eszköz, amely egyszer letaszítja a trónról a Bitcoint? A közelmúltban különösen sok figyelmet kapott a Zcash, amely az elmúlt egy évben látványos árfolyam-emelkedést produkált. A privát tranzakciókat lehetővé tevő technológiája miatt egyesek szerint akár komoly kihívóvá is válhat a kriptovaluták királyával szemben. De mennyire reális az, hogy egyszer a Zcash értéke meghaladja a Bitcoinét?
2026. 03. 11. 19:00
Megosztás:

A hazai ízekre és fogásokra fókuszálnak az idei MBH Bank Gourmet Fesztiválon

Május vége helyett idén június 4-7. között rendezik meg az MBH Bank Gourmet Fesztivált a Millenárison, ezúttal fókuszban a magyar vidékkel, a hazai ízekkel és fogásokkal.
2026. 03. 11. 18:30
Megosztás:

Mi váltja fel az év végén elköszönő ÁNYK-t?

Az Általános Nyomtatványkitöltő Keretprogram (ÁNYK) közel két évtizeden át volt a magyar adóügyintézés egyik legfontosabb “munkalova”: bevallások, adatszolgáltatások és számos hatósági űrlap beadása vált mindennapos rutinfeladattá rajta keresztül. Az utóbbi években viszont egyre látványosabban kijöttek a keretrendszer határai, és az is világossá vált, hogy működési logikája nem illeszthető az adóhatóság adatvezérelt stratégiájába. A döntés megszületett: 2026. december 31-én kivezetik az ÁNYK-t. Ezt követően az adóbevallások és adatszolgáltatások beküldése csak korszerű, adatalapú csatornákon történhet.
2026. 03. 11. 18:00
Megosztás: