Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

2026-ban 11 százalékkal nőtt a minimálbér, 7 százalékkal a garantált bérminimum

Január 1-jétől 11 százalékkal, 322 800 forintra emelkedett a minimálbér, míg a garantált bérminimum 7 százalékkal, 373 200 forintra nőtt – a kormány, valamint a munkavállalói és munkáltatói érdekképviseletek egyhangú megállapodásának eredményeként.
2026. 01. 02. 08:40
Megosztás:

Már több mint 60 ezren használják üzleti céllal a Microsec e-Szignó minősített elektronikus aláíró megoldásait

Ütemesen terjedt Magyarországon az üzleti célú elektronikus aláírás 2025-ben, már több mint 60 000 cégvezető, ügyvéd, könyvelő, mérnök használja, számítógépén vagy okostelefonján a Microsec e-Szignó minősített elektronikus aláíró megoldásait - közölte az elektronikus aláírás technológiával foglalkozó, magyar tulajdonú Microsec szerdán az MTI-vel.
2026. 01. 02. 07:00
Megosztás:

Ciprus átvette az Európai Unió Tanácsának soros elnökségét

Ciprus átvette csütörtökön a félévente váltakozó európai uniós tanácsi elnökséget; a mintegy egymillió lakosú szigetország június végéig vezeti a tagállami kormányok tanácskozásait, és közvetítő szerepet tölt be a tagországok közötti vitákban.
2026. 01. 02. 06:00
Megosztás:

A globális pénzügyi válság óta a legjobb évét zárta a londoni tőzsde

A 2008-2009-es globális pénzügyi válság óta a legjobb évét zárta londoni értéktőzsde (LSE), amelynek fő indexe több mint 20 százalékkal emelkedett az idén.
2026. 01. 02. 05:00
Megosztás:

NAV: elérhetők az édesanyáknak és a családoknak járó kedvezményekről szóló adóelőleg-nyilatkozatok

Már elérhetők az édesanyáknak és a családoknak járó kedvezményekről szóló adóelőleg-nyilatkozatok - tájékoztatta a Nemzeti Adó- és Vámhivatal (NAV) csütörtökön az MTI-t.
2026. 01. 02. 04:00
Megosztás:

AM: január 1-től csökkennek a gazdák adó- és adminisztrációs terhei

Év elejétől több olyan könnyítés is érvénybe lépett, amelyet a kormány a mezőgazdasági szereplők adó- és adminisztrációs terheinek csökkentése érdekében fogadott el. Ezeknek köszönhetően kiszámíthatóbbá válik a termelés, tovább erősödik a gazdák versenyképessége, ráadásul az intézkedések hozzájárulnak hazánk élelmiszer-biztonságának megőrzéséhez - közölte Nagy István agrárminiszter az Agrárminisztérium (AM) csütörtöki közleménye szerint.
2026. 01. 02. 02:00
Megosztás:

Ön is kaphat 8000 Ft nyugdíjemelést 2026-ban! Mutatjuk hogyan kell igényelni

Az igényelhető nyugdíj neve: méltányossági nyugdíj. Pontosan mit is jelent a méltányossági nyugdíj 2026-ban a jogszabály szerint? Érdemes ismerni a pontos szabályokat, mert akár havi max. 8.000 Ft-ot is kérelmezhetünk méltányossági emelésként. Hogyan lehet élni ezzel a lehetőséggel? Ki igényelheti és milyen összegű nyugdíj esetén tudunk élni a lehetőséggel? Cikkünkben az ado.hu szakmai portál útmutatásai alapján részletesen körüljárjuk a témát.
2026. 01. 02. 01:00
Megosztás:

Lemaradtál a 2021-es bikapiacról? A Digitap ($TAP) a legjobb kriptós előértékesítés

Sok befektető máig úgy tekint a 2021-es bikapiacra, mint egy elszalasztott lehetőségre, amikor a megfelelő projektekbe történő korai belépés életre szóló hozamokat eredményezett. Azóta a piacok érettebbé váltak, a hype-ciklusok kifulladtak, és a tőke sokkal szelektívebb lett.
2026. 01. 01. 22:00
Megosztás:

Miért esik ma a kripto-piac? 5 ok, amiért érdemesebb a Digitap ($TAP) tokent vásárolni

A kriptopiac újabb nyugtalanító epizódon van túl karácsony után, a legtöbb token árfolyama csökkenést mutatott. Az év végén jellemzően alacsony a likviditás, gyenge a kockázatvállalási hajlandóság, és a befektetői bizalom komoly próbát áll ki. A helyzetet tovább rontotta a Trust Wallet feltörése, amely 7 millió dolláros felhasználói veszteséget eredményezett.
2026. 01. 01. 20:00
Megosztás:

Tizenhat esetben tettek feljelentést a rendőrök Budapesten pirotechnikai termékek illegális árusítása miatt

Pirotechnikai termékek illegális árusítása miatt 16 esetben tettek szabálysértési feljelentést a rendőrök szilveszter éjszakáján a fővárosban, az intézkedések során 181 csomag pirotechnikai terméket vettek el - közölte a Budapesti Rendőr-főkapitányság (BRFK) csütörtökön a police.hu oldalon.
2026. 01. 01. 18:00
Megosztás:

A mentők szilveszterkor 3823 esetnél nyújtottak segítséget

A mentők szilveszterkor 3823 esetnél nyújtottak segítséget, az orvosi ügyeleteken 1783 beteg kapott ellátást - közölte az Országos Mentőszolgálat szóvivője csütörtökön az MTI-vel.
2026. 01. 01. 16:00
Megosztás:

240 tűzoltói beavatkozás történt szilveszterkor

Az év utolsó napján országszerte 240 helyszínre riasztották a tűzoltókat, 123 esetben tűz miatt, 117 alkalommal pedig műszaki mentést igénylő helyzethez - közölte az Országos Katasztrófavédelmi Igazgatóság szóvivője csütörtökön az MTI-vel.
2026. 01. 01. 14:00
Megosztás:

Különleges meteorraj érkezik január első napjaiban

Január első napjaiban érkezik a Quadrantidák meteorraj, továbbá egy látványos négyes együttállás is megfigyelhető lesz az éjszakai égbolton - közölte a Svábhegyi Csillagvizsgáló hétfőn az MTI-vel.
2026. 01. 01. 13:00
Megosztás:

Vigyázz a havas utak miatt, ha útnak indulsz az Újév napján!

Bár a meteorológiai prognózisokban van némi bizonytalanság, az aktuális előrejelzések szerint óév utolsó időszakában, illetve az újév első napjaiban többször várható kisebb havazás, 2026 első hétvégéjén pedig akár nagyobb mennyiségű hó is hullhat a fővárosban.
2026. 01. 01. 12:00
Megosztás:

Már több mint 20 ezer fiatal jutott lakáshoz az Otthon Start Programnak köszönhetően

Az elmúlt négy hónapban 20 ezer fiatal tudta megvásárolni első otthonát az Otthon Start Programnak köszönhetően - mondta a Miniszterelnökség parlamenti és stratégiai államtitkára a Facebookra feltöltött videónyilatkozatában.
2026. 01. 01. 11:00
Megosztás:

Energiaügyi Minisztérium: az otthonteremtést segítő beruházásokkal is csökkenthetik adóterheiket az áramelosztók

A vállalkozási adócsökkentési megállapodás részeként 2026-tól az energiaellátók egyes hálózati fejlesztéseik után új kedvezményt vehetnek igénybe jövedelemadójukból. Az adóterhek csökkentéséért elvégzendő beruházásokkal teljesítendő szakmai elvárásokat miniszteri rendelet rögzíti. Az adókedvezményt az elosztói engedélyesek például az Otthon Start Program keretében megépülő lakások csatlakoztatását vagy a zárolt körzetek feloldását szolgáló fejlesztések megvalósításával érvényesíthetik - ismerteti az Energiaügyi Minisztérium az MTI-hez hétfőn eljuttatott közleményében.
2026. 01. 01. 10:00
Megosztás:

Kié lett a 7 milliárdos lottó főnyeremény Szilveszterkor?

Sajnos nem született telitalálat az Ötöslottón január elsején, így a Szilveszteri Szuperlottó extra nyereménye nem talált gazdára. Az átlagosnál több volt viszont a négytalálatos szelvény, amelyek egyenként 2.347.060 millió forintot érnek.
2026. 01. 01. 09:00
Megosztás:

A Cardano Midnight új hardforkkal készül a mainnet indulására

Miközben egyre több figyelem irányul a blokkláncok adatvédelmi képességeire, a Cardano ökoszisztémájához tartozó Midnight hálózat újabb fontos mérföldkőhöz érkezett. A fejlesztők bejelentették a legújabb hardforkot, amely lehetővé teszi a jövőbeli frissítések zökkenőmentes kezelését – mindezt anélkül, hogy a hálózat működését meg kellene szakítani. A lépés nemcsak technikai előrelépés, hanem egyre erősebb üzenet is a blokkláncok adatvédelmi jövőjéről.
2026. 01. 01. 08:30
Megosztás:

A stabilcoin kamattilalom hátrányba hozhatja Amerikát a digitális versenyben Kínával szemben

Miközben Kína gőzerővel fejleszti digitális jegybankpénzét (e-CNY), az Egyesült Államokban komoly vita bontakozott ki a stabilcoinok kamatfizetésének tilalmáról. A Coinbase szabályozási igazgatója szerint a szigorú amerikai hozzáállás akár globális pénzügyi hátrányba is sodorhatja az USA-t, különösen, ha Kína megvalósítja terveit a digitális jüan kamatozóvá tételére 2026-tól. Vajon az amerikai dollár elsőbbsége veszélybe kerülhet a tokenizált jövő pénzügyi rendszerében?
2026. 01. 01. 03:00
Megosztás:

Újabb Revolut szigorítás Magyarországon - újabb funkciót vezet ki a szolgáltató

Lezárult a Revolut magyarországi készpénzbefizetési pilot programja, azonban a várt országos bevezetés helyett végül a szolgáltatás megszüntetése mellett döntött a fintech cég.
2026. 01. 01. 02:00
Megosztás: