Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

IT-karrier Magyarországon: nem csak a fővárosban pörög a piac

Ha informatikai pályáról van szó, sokáig szinte automatikusan Budapest jutott eszünkbe. A multinacionális cégek, a startup-ökoszisztéma, a nemzetközi fejlesztőközpontok mind a fővároshoz kötődtek. Az IT-karrier egyet jelentett a budapesti költözéssel, vagy legalábbis a rendszeres ingázással. Az elmúlt években azonban látványosan átalakult a piac.
2026. 02. 26. 20:30
Megosztás:

Rekordösszegű agrártámogatások erősítik a magyar gazdákat

A kormány célja, hogy márciusig a beruházási intézkedésekhez kapcsolódó kötelezettségvállalások összege elérje az 1000 milliárd forintot - jelentett ki Tállai András, az Agrárminisztérium parlamenti államtitkára, a Borsod Agroker Zrt. csütörtöki agrárkonferenciáján Miskolcon a tárca MTI-nek küldött közleménye szerint.
2026. 02. 26. 20:00
Megosztás:

A kecskeméti Mercedes-gyár munkavállalóinak száma elérte az ötezret

A kecskeméti Mercedes-gyár tovább bővül; az idén már 140 új munkatársat vettek fel, így a létszám elérte az ötezer főt - jelentette be Jens Bühler, a Mercedes-Benz Manufacturing Hungary Kft. ügyvezetője és gyárigazgatója csütörtökön Kecskeméten.
2026. 02. 26. 19:30
Megosztás:

Buterin 4 éves mesterterve: villámgyors és kvantumálló lehet az Ethereum

Radikális gyorsulás és kvantumbiztos jövő – az Ethereum következő négy éve alapjaiban írhatja át a hálózat működését. Vitalik Buterin részletes ütemtervet vázolt fel, amely a blokkok előállítását másodpercek alá szorítaná, miközben a láncot a kvantumszámítógépek fenyegetésére is felkészítené.
2026. 02. 26. 19:00
Megosztás:

Foglaló vagy előleg? A különbség, ami vitánál mindent eldönthet

Ingatlanvásárlásnál szinte mindig felmerül az előleg vagy foglaló kérdése. Sokan azt hiszik, ugyanazt jelenti a kettő, de ez tévedés. Egy jogvita esetén pont ezen múlhat, hogy visszakapod-e a pénzed, vagy végleg búcsút inthetsz neki. Tudd meg, mit vállalsz, mielőtt aláírsz bármit!
2026. 02. 26. 18:30
Megosztás:

Hatéves csúcs is megdőlt a magyar lakásépítésben, és még csak most jön a java!

Több mint 28 ezer új lakásra adtak ki építési engedélyt Magyarországon 2025-ben, ez 37%-kal volt magasabb a 2024-es adatnál. Közben a használatba vételi engedélyek száma 9 százalékkal esett vissza, így alig 12 ezer lakás készült el az országban. Nem csak a budapesti piac indult élénkülésnek, a megyei jogú városokban például hatéves csúcs dőlt meg az építési engedélyek számában. Az igazi piaci felfutás pedig csak most indulhat be, hiszen tavaly egy sor olyan kormányzati program indult, melyek a kínálat élénkülését célozzák – mutat rá friss elemzésében az OTP Ingatlanpont.
2026. 02. 26. 18:00
Megosztás:

1 milliárd TPS az AI-korszak küszöbén? A Stripe szerint brutális skálázás vár a blokkláncokra

Az AI-ügynökök (AI agents) hamarosan az internet fő tranzakciókezelőivé válhatnak – és ez olyan terhelést zúdíthat a blokkláncokra, amire a jelenlegi infrastruktúra egyszerűen nincs felkészülve. A Stripe vezetői szerint akár másodpercenként 1 milliárd tranzakció (1B TPS) is szükséges lehet a jövőben.
2026. 02. 26. 17:30
Megosztás:

Üzembe helyezték az Alteo új villamosenergia-tárolóját Győrben

Üzembe helyezték az Alteo új, mintegy 100 megawattóra (MWh) kapacitású villamosenergia-tárolóját Győrben, amely az eddig átadott legnagyobb ipari energiatároló Magyarországon, a most átadott energiatároló a beépített magyar tárolói teljesítmény mintegy egyötödét adja - közölte a Alteo csütörtökön az MTI-vel.
2026. 02. 26. 17:00
Megosztás:

Újabb rádióműsorok készülhetnek a médiatanács támogatásával

Megközelítőleg 90 millió forint támogatást szavazott meg rádióműsorok készítésére a Nemzeti Média- és Hírközlési Hatóság (NMHH) Médiatanácsa. Emellett a hatóság a klasszifikációs rendelkezések megsértése miatt egy újabb ügyben fordult a luxemburgi társhatósághoz - közölte a hatóság kommunikációs igazgatósága csütörtökön az MTI-vel.
2026. 02. 26. 16:30
Megosztás:

200 milliárd forinttal emelkedik a Demján Sándor Program EXIM-es konstrukcióinak keretösszege

Újabb 200 milliárd forinttal növeli a Kormány az EXIM Magyarország Demján Sándor Programban elérhető finanszírozási termékeinek keretösszegét, amely így összesen 900 milliárd forintra bővül. A keretemelés célja, hogy a hazai kis- és középvállalkozások kedvező feltételek mellett juthassanak fejlesztéseiket és működésüket támogató forrásokhoz a jelenlegi piaci környezetben is, ezzel erősítve versenyképességüket, valamint exportpiaci jelenlétüket.
2026. 02. 26. 16:00
Megosztás:

A csendes stabilcoin-forradalom: Tőkeátrendeződés a kriptopiacon

„A kriptó haldoklik!” – ez a szlogen az elmúlt hetekben többször is megjelent a közbeszédben. Valóban, ha kizárólag a legismertebb kriptovaluták árfolyamát nézzük, könnyen támadhat ilyen benyomásunk.
2026. 02. 26. 15:30
Megosztás:

Prémium SUV-ok előretörése: ennyit változott egy év alatt a német mezőny élvonala

Jelentős szerkezeti átrendeződés látható a német prémium márkák között a hazai használtautó piacon 2025 és 2026 januárját összehasonlítva. Míg egy évvel ezelőtt még a BMW 3-as sorozat vezette a toplistát 8 200 érdeklődéssel, addig 2026 januárjára a BMW X-sorozat került az élre 6 600 érdeklődéssel. A 3-as iránti kereslet egy év alatt közel 29%-kal csökkent, így a második helyre szorult vissza. A változás jól mutatja, hogy a prémium szegmensben a SUV-vonal végleg átvette a vezető szerepet a klasszikus szedánoktól.
2026. 02. 26. 15:00
Megosztás:

Az Erste Csoportnál folytatódott az erős növekedés a lakossági és vállalati üzletágban

Az Erste Csoport sikeres 2025-ös pénzügyi évre tekinthet vissza. A bankcsoport 3,5 milliárd eurós nettó eredményt ért el (2024: 3,1 milliárd euró). A növekedést elsősorban a lakossági és vállalati szegmens további bővülése alapozta meg, de egyszeri tételek is szerepet játszottak benne. A nettó eredmény kétharmadát a csoport Ausztrián kívüli leánybankjai adták. A CET1 ráta jelentősen, 19,3 százalékra emelkedett, stabil tőkehelyzetet biztosítva a lengyelországi akvizícióhoz.
2026. 02. 26. 14:30
Megosztás:

Kínálati fordulat jellemezheti a lakáspiacot 2026-ban

Kedvezőnek ígérkeznek a lakáspiac idei kilátásai Magyarországon: az építési engedélyek számának látványos növekedése és a fokozódó fejlesztői aktivitás a kínálat erősödését vetíti előre. Mindeközben a támogatott hitelkonstrukciók továbbra is segíthetik a vásárlókat, a lakásárak emelkedésének üteme pedig várhatóan mérséklődik a tavalyi szinthez képest – derül ki az MBH Jelzálogbank 2026-os lakáspiaci prognózisából.
2026. 02. 26. 14:00
Megosztás:

Március elejéig használható a Webes Ügysegéd az egyéni vállalkozók bejelentéseire

Február közepén élesedett a Vállalkozói Ügysegéd, amely a NAV Ügyfélportál (ÜPO) részeként az egyéni vállalkozók bejelentéseinek kezelésére szolgál, és ezeknél az ügyintézéseknél átveszi a Webes Ügysegéd szerepét, március 1-ig a régi felület, a Webes Ügysegéd is használható, de ott ezután már nem lehet ilyen bejelentést indítani - hívta fel a figyelmet csütörtökön a Nemzeti Adó- és Vámhivatal (NAV) csütörtökön az MTI-nek küldött közleményében.
2026. 02. 26. 13:30
Megosztás:

2026-ot is lendületesen kezdte a hazai turizmus

2025-ben rekordévet zárt a hazai turizmus, a minden korábbinál nagyobb számú – 20 millió – vendég, minden korábbinál több, mintegy 47 millió vendégéjszakát töltött a magyarországi szálláshelyeken. Az idei év is jól indult, januárban a vendégek száma 5,3 százalékkal, míg az általuk eltöltött éjszakáké 3,6 százalékkal bővült az előző év azonos időszakához képest, ez kedvező kiindulási alap, hogy 2026-ban tovább nőjön a hazai turizmus. A kormány ezt olyan intézkedésekkel erősíti, mint a fix 2,5%-os kamatozású KTH Start-hitel, a KTH Start 2=3 akció, valamint az 5+1 pontból álló vendéglátóipari akcióterv.
2026. 02. 26. 13:00
Megosztás:

A WLFI új staking modellt és USD1-ösztönzőket vezetne be

A Trump család támogatását élvező kriptovállalkozás, a World Liberty Financial (WLFI) új javaslatot terjesztett elő, amely egyszerre reformálná a governance rendszert és pörgetné fel a saját stabilcoinja, az USD1 használatát. A terv középpontjában egy 180 napos staking alapú szavazási modell és célzott DeFi-ösztönzők állnak – mindezt egy olyan piacon, ahol továbbra is az USDC és az USDT dominál.
2026. 02. 26. 12:30
Megosztás:

Újból elérhető a lakossági távhőpályázat

Csütörtöktől újból elérhető a lakossági távhőpályázat - jelentette be hivatalos Facebook-oldalán az Energiaügyi Minisztérium (EM).
2026. 02. 26. 12:00
Megosztás:

A nettó keresetek jobban emelkednek mint a bruttók

Hónapok óta az látható, hogy a nettó keresetek nagyobb arányban növekednek, mint a bruttók - jelentette ki a Nemzetgazdasági Minisztérium (NGM) foglalkoztatáspolitikáért felelős államtitkára csütörtökön az M1 aktuális csatornán.
2026. 02. 26. 11:30
Megosztás:

Átlépte az 1 billió dollárt az Aave hitelezése

Az RWA-piacok megnyitása új korszakot indíthat a DeFi-ben. Az Aave történelmi mérföldkőhöz érkezett: a protokoll kumulatív hitelezési volumene meghaladta az 1 billió dollárt, miközben elindult a Horizon nevű, intézményi szereplőkre szabott RWA-piac. A rekord nemcsak a decentralizált hitelezés (DeFi lending) iránti tartós keresletet mutatja, hanem azt is, hogy az on-chain hitelpiac egyre szorosabban kapcsolódik a hagyományos pénzügyi szektorhoz (TradFi).
2026. 02. 26. 11:00
Megosztás: