Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Termékenység és hormonális egyensúly: mio-inozitol és a PCOS összefüggései

A policisztás ovárium szindróma (PCOS) egy elég gyakori hormonális probléma, amely számos nő reproduktív egészségére hatással van világszerte. Egyes adatok szerint minden tizenötödik nő találkozik ezzel az állapottal, és gyakran termékenységi nehézségekkel társul.
2026. 02. 15. 16:00
Megosztás:

ZCash árfolyamrali: nagy forgalommal tör előre a ZEC – visszatérhet a 400 dolláros szint?

Erőteljes vételi hullám söpört végig a ZCash piacán: a ZEC egyetlen nap alatt több mint 24%-ot emelkedett, miközben a kereskedési volumen 71%-kal ugrott meg. A technikai kép javul, de a kulcskérdés továbbra is az: képes lehet-e az árfolyam visszahódítani a lélektani 400 dolláros szintet?
2026. 02. 15. 15:00
Megosztás:

35%-os napi raliban a Pi Coin: határidő és node-frissítés hajtja a PI árfolyamát

Látványos fordulatot vett a Pi Network natív tokenje, a PI árfolyama, miután hetekig tartó lejtmenet után egyetlen nap alatt több mint 35%-ot emelkedett. A háttérben közelgő technikai határidő és erősödő közösségi bizalom állhat – de vajon fenntartható-e a lendület?
2026. 02. 15. 14:00
Megosztás:

Csökkenő forgalomban esett a BUX a héten

Csökkenő forgalomban esett a Budapesti Értéktőzsde (BÉT) részvényindexe a héten, pénteken a BUX 126 964,02 ponton zárt, 2,36 százalékkal, 3066,32 ponttal alacsonyabban, mint az előző héten.
2026. 02. 15. 13:00
Megosztás:

Kereseti és lakásépítési adatokat közölnek a jövő héten

A jövő héten közli a Központi Statisztikai Hivatal (KSH) a keresetek tavaly decemberi és a lakásépítések, építési engedélyek tavalyi I-IV. negyedévi statisztikáit.
2026. 02. 15. 12:00
Megosztás:

Erős szélre figyelmeztet a katasztrófavédelem

A meteorológiai előrejelzések szerint a Dunántúlon és az északkeleti országrészben viharos szél várható - közölte Mukics Dániel tűzoltó alezredes az MTI-vel vasárnap. A MÁV-csoport tájékoztatása szerint az extrém erejű szél miatt a Balaton környékén fakidőlések, felsővezetéki hibák nehezítik a vasúti forgalmat.
2026. 02. 15. 11:00
Megosztás:

Megérkezett a biztosítók levele: hamarosan indul a lakásbiztosítási kampány

Fontos dátum közeleg: márciusban már harmadik alkalommal indul el a lakásbiztosítási kampány, amely során az ügyfelek a szerződés évfordulójától függetlenül válthatnak biztosítást. Az ezzel kapcsolatos tájékoztató levelet február közepéig kellett kiküldenie a biztosítóknak. A Bank360 szakportál összefoglalta, hogyan érdemes felkészülni a kampány előtt az ügyfeleknek, ha váltani szeretnének.
2026. 02. 15. 10:00
Megosztás:

Nem csak a kamatok csökkennek, a futamidők is nyúlnak a személyi kölcsönöknél

A közelmúltban újabb nagybank hosszabbította tíz évre a maximális futamidőt a személyi kölcsönénél, így is növelve az ügyfelek mozgásterét – hívja fel a figyelmet a BiztosDöntés.hu pénzügyi szakújságírója. Ennek nyomán számítani lehet arra, hogy a közeljövőben még több szolgáltató tolja majd kijjebb a maximális futamidőt – és persze folytatódik az intenzív kamatverseny is a személyi kölcsönöknél.
2026. 02. 15. 09:00
Megosztás:

Az új KRESZ-ben kiemelt figyelmet kapnak a fogyatékossággal élők

A fogyatékossággal élőket képviselő szervezetekkel folytatódott pénteken az új KRESZ-szabályok egyeztetése. Az Építési és Közlekedési Minisztérium (ÉKM) széleskörű társadalmi és szakmai egyeztetések keretében tekinti át az új KRESZ tervezetét, valamint az arra beérkező észrevételeket - közölte a tárca szombaton az MTI-vel.
2026. 02. 15. 07:00
Megosztás:

Nagy-Britannia repülőgéphordozó-flottát telepít az Atlanti-óceán északi vizeire

Nagy-Britannia repülőgéphordozó-flottát telepít az Atlanti-óceán északi vizeire - jelentette be Keir Starmer brit miniszterelnök szombaton.
2026. 02. 15. 06:00
Megosztás:

Ásványvizeket hívtak vissza

Az AVE Ásványvíz Gyártó és Forgalmazó Kft. és Magyarvíz Kft. visszahívta egy-egy ásványvizét - Mikrobiológiai nem megfelelőség miatt közölte a Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) pénteken az MTI-vel.
2026. 02. 15. 05:00
Megosztás:

Éledezik a lakáspiac: növekvő érdeklődés, bizakodó ingatlanértékesítők

Ha az adásvételekben egyelőre nem is mutatkozik meg az egy évvel korábbi ingatlanpiaci fellendülés, az érdeklődések száma már emelkedést mutat, és az ingatlanértékesítők is optimistábban tekintenek 2026-ra - derül ki a zenga.hu ingatlanértékesítők körében végzett felméréséből.
2026. 02. 15. 04:00
Megosztás:

A krőzusadóval okkal azonosul a társadalom, de a valóság józanabb kivitelezést követel

Tényleg a budai belső kerületek lakói lesznek az új vagyonadó célkeresztjében? A Blochamps elemzése szerint az egymilliárdos „gazdag-küszöb” ma már nem a kivételes vagyont jelöli, sokkal inkább az elmúlt évtized inflációját és ingatlanár-robbanását tükrözi. Ráadásul a matek sem jön ki: A Blochamps szerint az 1%-os vagyonadó optimista becsléssel is legfeljebb 170 milliárd forintot hozhatna. Eközben nemzetközi példák jelzik: a tisztán vagyonadó bázisú beszedési törekvések hatékonytalanságuknál fogva alkalmatlanok arra, hogy elérjék a politikai céljaikat, a dúsgazdagok „krőzusadó” általi arányosabb közteherviselését.
2026. 02. 15. 03:00
Megosztás:

Törvényi döntés, ha cigit sodorsz házilag

Sokan gondolják úgy, hogy a házilag sodort cigaretta kevésbé szabályozott terület, mint a bolti dobozos termékek világa. A valóság azonban az, hogy Magyarországon a dohánytermékekre vonatkozó jövedéki szabályozás a saját célra sodrókat is érinti. Egy aprónak tűnő félreértés komoly pénzbírsághoz vagy akár eljáráshoz is vezethet.
2026. 02. 15. 02:00
Megosztás:

Elfogadták a törvényt – így számolják a nyugdíjat a jövőben

Megszületett a döntés: a jogalkotó részletesen rögzítette, milyen szabályok alapján számítják ki az öregségi nyugdíjat a jövőben. Bár a törvényi szöveg első olvasásra bonyolult és nehezen átlátható, a lényeg néhány alapelvre egyszerűsíthető. Összefoglaltuk közérthetően, mitől függ a nyugdíj összege, milyen jövedelmek számítanak bele, és hol vannak a legfontosabb korlátok.
2026. 02. 15. 01:00
Megosztás:

Ezekkel a számokkal nyerhettél az ötös lottón!

A Szerencsejáték Zrt. tájékoztatása szerint a 7. héten megtartott ötös lottó és Joker számsorsoláson a következő számokat húzták ki:
2026. 02. 15. 00:05
Megosztás:

Ethereum derivatív „reset”: 80 millió ETH tűnt el a nyitott pozíciókból

Látványos tőkeáttétel-leépítés zajlik az Ethereum piacán. Az elmúlt 30 napban több mint 80 millió ETH-val csökkent a nyitott érdekeltség (open interest) a vezető kriptotőzsdéken, ami egyértelműen a derivatív piac „lehűlésére” utal. A folyamat nem egyetlen platform sajátossága, hanem átfogó, piaci szintű jelenség.
2026. 02. 14. 23:00
Megosztás:

Az IMF egyszerűsítette az Ukrajnának szánt új finanszírozási program feltételeit

A Nemzetközi Valutaalap (IMF) egyszerűsítette az Ukrajnának szánt új, kiterjesztett finanszírozási program (EFF) feltételeit - jelentette be Julija Szviridenko ukrán miniszterelnök szombaton.
2026. 02. 14. 22:00
Megosztás:

Elon Musk pénzügyi szuperappot épít: Közel az X kripto- és részvénykereskedési rajtja

Elon Musk egyre közelebb kerül ahhoz, hogy az X platformot teljes értékű kripto- és részvénykereskedési szuperappá alakítsa. Az X Money jelenleg belső tesztelés alatt áll, a nyilvános béta pedig akár 30–60 napon belül elindulhat – ezzel 2026 tavaszán élesedhet a platform pénzügyi funkcióinak első hulláma.
2026. 02. 14. 21:00
Megosztás:

15%-ot ugrott a Solana Company részvénye: intézményi hitelezési modell indul a stakelt SOL-ra

Erőteljes ralit produkált a Solanához köthető részvény, miután a vállalat új, intézményi szintű hitelezési konstrukciót jelentett be a stakelt SOL fedezetére. A piac pozitívan reagált arra a lehetőségre, hogy a cégek likviditást szabadíthatnak fel treasury-állományaikból anélkül, hogy el kellene adniuk digitális eszközeiket.
2026. 02. 14. 20:00
Megosztás: