Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Profitálhat-e a Bitcoin a mesterséges intelligencia térnyeréséből?

A mesterséges intelligencia egyre több olyan feladatot végez el, amely korábban kizárólag emberekhez kötődött, beleértve a pénz kezelését, mozgatását és optimalizálását is. Az úgynevezett „agentic AI” irányzat terjedésével egyre reálisabbá válik, hogy pénzügyi döntéseket és tranzakciókat nem emberek, hanem szoftverek indítanak el – akár saját működésük érdekében, nem pedig közvetlen emberi haszonért.
2026. 02. 08. 04:00
Megosztás:

Nyugdíjas vagy, de nem tudod, hová fordulj a problémáddal? Ez a „titkos térkép” megmutatja

A magyar nyugdíjrendszer egyik legnagyobb buktatója nem a szabályok bonyolultsága, hanem az, hogy sokan nem tudják, melyik ügyükkel pontosan melyik hivatalhoz kell fordulniuk. Emiatt hónapok csúszhatnak el, kérelmek pattannak vissza, és nem ritkán pénz is elúszik. Az alábbi gyakorlati útmutató abban segít, hogy nyugdíjasként vagy nyugdíj előtt állóként pontosan tudd, kihez kell menned az adott problémával.
2026. 02. 08. 03:00
Megosztás:

Tarot kártya 2026 – Megérkezett a személyes jóslatod!

2026 sorsfordító év lehet számodra. A tarot lapjai nem véletlenül kerülnek elő: rejtett lehetőségekre, döntésekre és belső átalakulásra hívják fel a figyelmedet. Olvasd úgy a jóslatot, mintha neked üzenne – mert pontosan ezt teszi.
2026. 02. 08. 02:00
Megosztás:

Újraszámolják a nyugdíjadat, ha igaz Rád ez a feltétel!

Sokan reménykednek abban, hogy a nyugdíjuk összege utólag megemelhető, ám a valóság jóval szigorúbb: 2026-ban is csak nagyon korlátozott esetekben van mód a nyugdíj újraszámítására. A szabályok azonban léteznek, és akik megfelelnek a feltételeknek, komoly összegektől eshetnek el, ha nem élnek időben a lehetőséggel.
2026. 02. 08. 01:00
Megosztás:

Ezzel a trükkel felére csökkentheted az áramzabáló hűtőszekrényed fogyasztását

Csendben, észrevétlenül falja az áramot – a hűtőszekrény az egyik legnagyobb rezsinyelő a háztartásban. Sokan nem is sejtik, hogy egy rossz beállítás vagy apró hiba miatt évente több tízezer forinttal fizetnek többet a kelleténél. A jó hír: néhány egyszerű megoldással drasztikusan csökkenthető a fogyasztás, akár azonnal.
2026. 02. 08. 00:01
Megosztás:

Ezekkel a számokkal nyerhettél az ötös lottón!

A Szerencsejáték Zrt. tájékoztatása szerint a 6. héten megtartott ötös lottó és Joker számsorsoláson a következő számokat húzták ki:
2026. 02. 07. 23:00
Megosztás:

Szoros együttműködésben az agrárgazdasági és a vadgazdálkodási szervezetek

A jövőben még szorosabban együttműködik a Nemzeti Agrárgazdasági Kamara (NAK), az Országos Magyar Vadászkamara és az Országos Magyar Vadászati Védegylet az agrárgazdálkodás, az erdőgazdálkodás és a vadgazdálkodás fenntartható működtetése érdekében - közölte a NAK szombaton az MTI-vel.
2026. 02. 07. 22:00
Megosztás:

Rekordmennyiségű marihuánát foglaltak le Észak-Macedóniában

Az északmacedón rendőrség csaknem 30 tonna marihuánát foglalt le két egykori ipari létesítményből, ez az eddigi legnagyobb ilyen jellegű fogás az országban - jelentette pénteken a helyi közszolgálati televízió (MRT).
2026. 02. 07. 21:00
Megosztás:

Belgrád hétszer sűrűbben lakott a szerb országos átlagnál

Belgrád népsűrűsége mintegy hétszerese az országos átlagnak, miközben Szerbia déli és keleti térségei folyamatosan veszítenek lakosságukból a belső gazdasági migráció következtében - derül ki demográfiai adatokból és szakértői elemzésekből.
2026. 02. 07. 19:00
Megosztás:

Orbán Viktor két hét múlva ismét találkozik Donald Trumppal

Orbán Viktor két hét múlva Washingtonban ismét találkozik Donald Trump amerikai elnökkel, amikor a Békatanács alakuló ülését tartják az amerikai fővárosban. Ezt a magyar kormányfő jelentette be szombaton a Digitális Polgári Körök (DPK) szombathelyi háborúellenes gyűlésén.
2026. 02. 07. 18:00
Megosztás:

Évtizedes csúcson a magyar szabadalmi bejelentések száma

Évtizedes csúcson van a magyar szabadalmi bejelentések száma: 2025-ben 533 szabadalmi bejelentést tettek a magyar innovátorok - közölte Hankó Balázs kulturális és innovációs miniszter a Facebook-oldalán szombaton.
2026. 02. 07. 17:00
Megosztás:

Előrehaladott állapotban van a Dunai Finomító AV3 üzemének helyreállítása

Előrehaladott állapotban van a Dunai Finomító AV3 üzemének helyreállítása, határidő előtt befejeződött a tűzesetben sérült berendezések és szerkezeti elemek gépészeti bontása, folyamatban van a csőhálózat és a szivattyúk felújítása, május végére pedig elkészül az új kondenzátorállvány is - tájékoztatta a Mol pénteken az MTI-t.
2026. 02. 07. 16:00
Megosztás:

Super Bowl, NBI, téli olimpia – kedvükre válogathatnak a magyar sportfogadók

Sporteseményekben gazdag hétvége vár sportimádókra: indul a fogadási szezon az amerikai futballban és a hazai labdarúgásban, és a téli sportok kedvelői is izgatottan várják a közvetítéseket, hiszen Olaszországban elstartoltak a téli olimpiai játékok, ahol a 15 fős magyar küldöttségnek is szurkolhatunk. Lássuk, milyen eredményekben bíznak a magyar fogadók.
2026. 02. 07. 15:00
Megosztás:

Megerősítette Dánia lehetséges legjobb osztályzatát az S&P, diplomáciai megoldást valószínűsít Grönland ügyében

Megerősítette változatlan stabil kilátással Dánia hosszú és rövid lejáratú hazai és külső szuverén kötelezettségeinek lehetséges legjobb, "AAA/A-1 plusz" szintű besorolásait az S&P Global Ratings. A nemzetközi hitelminősítő a Londonban bejelentett döntés indoklásában kiemelte, hogy az Egyesült Államokkal Grönland ügyében kialakult viszály diplomáciai megoldását valószínűsíti.
2026. 02. 07. 14:00
Megosztás:

Megismétlik a boszniai szerb elnökválasztást néhány helyen

A szavazóhelyek 6 százalékában megismétlik vasárnap a boszniai szerb elnökválasztást a felvetődött szabálytalanságok miatt.
2026. 02. 07. 13:00
Megosztás:

Ennyivel olcsóbb a magyar üzemanyagok ára, mint a szomszédos országok árai

A szomszédos országok átlagához képest januárban is kedvezőbb üzemanyagárakkal találkozhattak a magyar családok a hazai töltőállomásokon.
2026. 02. 07. 11:00
Megosztás:

Meghaladták a jogdíjak a pandémia előtti mértéket, egyre több a fiatal szerző

2025-ben 15,2 milliárd forint jogdíjat fizetett ki a dalok, zeneművek szerzőinek az Artisjus, ami így reálértékben végre meghaladta a pandémia előtti szintet. Ennek az összegnek minden korábbinál nagyobb része járt a magyar szerzőknek összesen 22 945 főnek. Tovább nőtt a regisztráló új szerzők száma, és immár több mint az ötödük 20 év alatti.
2026. 02. 07. 10:00
Megosztás:

Milliárdok áramlanak a kriptoszektorba – a piaci visszaesés ellenére is dübörög a befektetési kedv

Hiába a több mint 2 billió dolláros piaci zuhanás, a kockázatitőke-befektetők továbbra is bíznak a kriptó jövőjében. Február első hetében 258 millió dollárt vontak be kriptovállalatok, és a fókusz egyre inkább az érettebb, intézményi partnerekkel rendelkező projektekre helyeződik.
2026. 02. 07. 09:00
Megosztás:

A külföldre induló síelők naponta átlagosan 930 forintért kötöttek síbiztosítást az idei szezon első felében

Az idei síszezon első felében a külföldre induló síelők naponta átlagosan 930 forintért kötöttek síbiztosítást, ez az összeg 10 százalékkal magasabb a tavalyi hasonló értéknél - közölte saját adatai alapján az Insura.hu pénteken az MTI-vel.
2026. 02. 07. 08:00
Megosztás:

Belgrád hétszer sűrűbben lakott a szerb országos átlagnál

Belgrád népsűrűsége mintegy hétszerese az országos átlagnak, miközben Szerbia déli és keleti térségei folyamatosan veszítenek lakosságukból a belső gazdasági migráció következtében - derül ki demográfiai adatokból és szakértői elemzésekből.
2026. 02. 07. 07:00
Megosztás: