Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Gyengült kissé a forint péntek reggelre

Gyengült kissé a forint péntek reggelre a főbb devizákkal szemben az előző esti jegyzéséhez képest a nemzetközi devizakereskedelemben.
2025. 12. 12. 08:00
Megosztás:

Idén is rekordévet zár a magyar turizmus

A 2024-es turisztikai rekord az idén már 11 hónap alatt teljesült, a szálláshelyeken regisztrált vendégek száma idén december 2-án elérte a 18 226 413-at, megdöntve ezzel a tavalyi egész éves vendégszámot, ami rekord volt - közölte a Visit Hungary Nonprofit Zrt. az MTI-vel.
2025. 12. 12. 07:40
Megosztás:

Export vezérelt növekedésére épít az Univer

A kihívásokkal teli gazdasági környezet ellenére is stabilan növekvő belföldi és exportpiaci keresletre reagálva új, korszerű logisztikai központtal erősíti ellátási láncát az Univer Product Zrt. Az új raktárbázis a vállalat három telephelyén gyártott késztermékek országos és külpiaci kiszolgálásának központi helyszíne lesz.
2025. 12. 12. 07:00
Megosztás:

Átadták a közmédia legrangosabb szakmai díjait

Három alapvető érték vezeti a közmédia dolgozóinak munkáját: az erkölcsi iránytű, a tiszta gondolkodás és az állhatatos szív - mondta Vitályos Eszter kormányzati kommunikációért felelős államtitkár csütörtökön a Budapest Music Centerben, ahol tíz kategóriában adták át a közmédia legrangosabb szakmai díjait.
2025. 12. 12. 06:30
Megosztás:

Vállalkozó vagy? Itt vannak a legfontosabb határidők 2026-ra, már most írd be a naptáradba

Egyéni vállalkozó vagy? Akkor már most írd fel a naptáradba ezeket a fontos jövő évi időpontokat a bevallásokkal, határidőkkel kapcsolatban. Érdemes mindent időben elrendezni, mert a késedelem bírsággal járhat. A Számlázz.hu, Magyarország egyik legnagyobb pénzügyi adminisztrációs szolgáltatója közel egymillió vállalkozóval dolgozik együtt és összeszedte, mire érdemes figyelni 2026-ban.
2025. 12. 12. 05:30
Megosztás:

Az akciók ereje: Hogyan lett a bizonytalanságból rekordköltés?

A magyarok idén bátrabban nyúltak a pénztárcájukhoz: a Black Friday és a karácsonyi vásárlási szezon a visszafogott előzetes becsléseket jóval túlszárnyalta, és a költések volumene elérte a 260 milliárd forintot. A PwC Magyarország októberi és novemberi lakossági kutatása szerint az online vásárlók stabilabbnak érzik jövedelmi helyzetüket és egyre tudatosabbak – 67% az akciók és kedvezmények alapján veszi meg a karácsonyi ajándékot, és az ünnepi költések mértéke elérheti a 340 milliárd forintot.
2025. 12. 12. 05:00
Megosztás:

Az adózást is átalakítja a mesterséges intelligencia

Világszerte a mesterséges intelligenciától (MI) várják az üzleti világot sújtó nehézségek megoldását a pénzügyi és adózási vezetők – derül ki az EY legújabb, 30 országra kiterjedő nemzetközi felméréséből. A válaszadók szerint az MI a következő két évben közel harmadával növelheti az adózási és pénzügyi területek hatékonyságát, és ötödével több erőforrást szabadíthat fel stratégiai feladatokra.
2025. 12. 12. 04:30
Megosztás:

Berobbant az Otthon Start, felejtsd el az alkut!

Ősszel a kedvezményes hitelprogram elindulásával felpörgött a lakáspiaci forgalom, ez pedig azzal is járt, hogy több alpiacon korábban soha nem látott szintre esett vissza az alku tere – derül ki az OTP Ingatlanpont által feldolgozott adatokból. A községeket kivéve minden településtípus esetében többéves mélypontra vagy sosem látott szintre esett a mozgástér az árakban, ami azt jelzi, hogy az Otthon Start nem csak Budapestet, hanem a vidéki városokat is felbolygatta.
2025. 12. 12. 04:00
Megosztás:

Kreml: a kétoldalú kapcsolatok továbbfejlesztésétől tárgyalt az orosz és a venezuelai elnök

A kétoldalú baráti kapcsolatok továbbfejlesztéséről folytatott eszmecserét telefonon Vlagyimir Putyin orosz és Nicolás Maduro venezuelai elnök - közölte csütörtökön a Kreml sajtószolgálata.
2025. 12. 12. 03:30
Megosztás:

Nagy István: az agrár-és élelmiszeripar, az élelmezésbiztonság nem lehet a politikai játéktér része

Az agrár- és élelmiszeripar, valamint az élelmezésbiztonság nem válhat a politikai játszmák részévé - hangsúlyozta Nagy István agrárminiszter csütörtökön Brüsszelben.
2025. 12. 12. 03:00
Megosztás:

Otthon Centrum: lassult az albérletárak drágulása

A fővárosban idén január és október között 271 ezer forint volt a téglalakások átlagos havi bérleti díja, 5,7 százalékkal magasabb a tavalyi éves átlagnál - közölte az Otthon Centrum (OC) az általa közvetített, lezárt tranzakcióinak adatai alapján az MTI-vel csütörtökön.
2025. 12. 12. 02:30
Megosztás:

A Wizz Air 60 milliomodik magyarországi utasát köszöntötte

A Wizz Air elérte a 60 milliós utasforgalmat Magyarországon, külön köszöntötték a 60 milliomodik magyarországi utasukat, aki a társaság első Tallinnba induló járatára szállt fel csütörtökön - közölte a légitársaság az MTI-vel.
2025. 12. 12. 02:00
Megosztás:

Az enyhe időben tovább erősödhettek az őszi vetések

Az elmúlt egy hétben az ilyenkor szokásosnál több fokkal enyhébb időben tovább fejlődhettek, erősödhettek az őszi vetések, amelyek számára a legtöbb helyen kellő mennyiségű nedvesség is rendelkezésre áll a talajban - írta a HungaroMet Zrt. csütörtöki agrometeorológiai elemzésében.
2025. 12. 12. 01:30
Megosztás:

90 milliós pályázat indul a hazai digitális játékfejlesztőknek

Dedikáltan a hazai digitális játékipari vállalkozások számára indít 90 millió forint keretösszegű inkubációs programot a Creative Hungary (korábbi nevén Magyar Divat & Design Ügynökség), az 5-15 millió forint értékű forrásra 2026. január 31-éig jelentkezhetnek a hazai játékkészítők - közölte a Creative Hungary (CH) az MTI-vel csütörtökön-
2025. 12. 12. 01:00
Megosztás:

Stratégiai megállapodást kötött a kormány és a GE HealthCare

Stratégiai együttműködési megállapodást kötött a kormány és a GE HealthCare, az amerikai orvostechnológiai társaság a kormány 101. stratégiai partnere - közölte a HIPA Nemzeti Befektetési Ügynökség csütörtökön az MTI-vel.
2025. 12. 12. 00:30
Megosztás:

J.P. Morgan és Galaxy Digital történelmet ír: Elindult az első amerikai kereskedelmi papír kibocsátás a Solana blokkláncon

A blokklánc technológia újabb mérföldkőhöz érkezett: a J.P. Morgan és a Galaxy Digital sikeresen végrehajtották az Egyesült Államok egyik első kereskedelmi papír (USCP – U.S. Commercial Paper) kibocsátását nyilvános blokkláncon, méghozzá a villámgyors Solana hálózaton. Az innováció nemcsak technológiai áttörést jelent, hanem megnyitja az utat az intézményi pénzügyi termékek új generációja előtt – stabilcoin alapú, programozható és transzparens.
2025. 12. 11. 23:30
Megosztás:

Stabilcoin-válság árnyékában – A mexikói jegybank figyelmeztetése a globális szabályozási széttagoltságra

Miközben Latin-Amerika több országa egyre gyorsabban halad a kriptovaluták elfogadása felé, Mexikó jegybankja óvatosságra int. A legfrissebb pénzügyi stabilitási jelentés szerint a stabilcoinok térnyerése komoly kockázatokat hordoz – különösen a globális szabályozási eltérések és a piaci koncentráció miatt. A Banxico szerint összehangolt nemzetközi fellépés nélkül akár a hagyományos pénzügyi rendszer is meginoghat.
2025. 12. 11. 23:00
Megosztás:

3 nagy potenciállal rendelkező altcoin, amely akár elérheti az 1 dolláros árfolyamot év végéig: DOGE, XLM és Digitap

A 2025-ös év legjobb "filléres" kriptovalutái? Nem kell tovább keresni: az XLM, a Dogecoin és a Digitap ($TAP) token tartozik a legígéretesebb altcoinok közé, amelyeket érdemes megvásárolni idén decemberben – legalábbis az iparági szakértők szerint.
2025. 12. 11. 22:00
Megosztás:

Binance újratölti a stabilcoin frontot – Trump-közeli USD1 kerül a középpontba

A világ egyik legnagyobb kriptotőzsdéje, a Binance új szintre emeli a stabilcoin stratégiáját: a Trump-családhoz köthető USD1 token veszi át a BUSD szerepét több területen is. A lépés nemcsak technikai, hanem politikai szempontból is figyelemre méltó, különösen egy nemrégiben történt elnöki kegyelem fényében.
2025. 12. 11. 21:30
Megosztás:

Tizenegy új műjégpálya nyílik

Megkezdődött az országos Adni Öröm! adománygyűjtő akció csütörtökön a Magyar Máltai Szeretetszolgálat és a Spar Magyarország szervezésében.
2025. 12. 11. 21:00
Megosztás: