Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Trump: közel a megállapodás a gázai túszok szabadon engedéséről

Jól haladnak a tárgyalások a gázai túszok kiszabadulásának részleteiről – közölte Donald Trump amerikai elnök vasárnap.
2025. 10. 06. 02:00
Megosztás:

Megalakult az új franca kormány, a miniszterek többsége a helyén maradt

Megalakult vasárnap este az új francia kormány, csaknem négy héttel azután, hogy Emmanuel Macron köztársasági elnök a korábbi védelmi minisztert, Sébastien Lecornut nevezte ki miniszterelnöknek. Az elnöki hivatal által közzétett listán szereplő 18 miniszter többsége már az előző, a centrista François Bayrou által vezetett kormánynak is tagja volt.
2025. 10. 06. 01:00
Megosztás:

A Bitcoin soha nem látott magasságokba emelkedett – áttörte a 125 000 dolláros határt

A világ legnagyobb kriptovalutája, a Bitcoin (BTC) új történelmi csúcsot ért el, miután vasárnap kora reggel 125 750 dollárig emelkedett. Ezzel a digitális eszköz megdöntötte az augusztusban felállított korábbi rekordját, és ismét a befektetői érdeklődés középpontjába került.
2025. 10. 05. 23:00
Megosztás:

Mi lesz a kriptovalutákkal, ha az amerikai kormányzati leállás elhúzódik?

Az Egyesült Államok szövetségi kormányának újabb leállása a kriptovaluták jövőjét is homályba borítja Washingtonban. Míg egy rövid szünet alig okozna fennakadást, egy elhúzódó válság könnyen megtörheti a lendületet a már folyamatban lévő szabályozási kezdeményezésekben – és ezzel együtt az intézményi kriptoadaptáció reményeiben is. A következő hetek kulcsfontosságúak lehetnek a kriptopiaci jogalkotás szempontjából.
2025. 10. 05. 21:00
Megosztás:

Andrej Babis egypárti kormány létrehozására készül

A csehországi választáson győzelmet arató ellenzéki Andrej Babis az eredmények közzététele utáni első sajtótájékoztatóján kijelentette, hogy célja egypárti kormány létrehozása, amelynek támogatásáról a Szabadság és Közvetlen Demokrácia (SPD) mozgalommal, valamint az Autósok párttal kíván tárgyalni.
2025. 10. 05. 20:00
Megosztás:

A Solana az új Wall Street” – állítja a Bitwise befektetési igazgatója

A Solana szerepe a tokenizált piacokért folytatott versenyben új figyelmet kapott a héten, amikor Matt Hougan, a Bitwise CIO-ja úgy nyilatkozott: „A Solana az új Wall Street.”
2025. 10. 05. 19:00
Megosztás:

A Bitcoin új történelmi csúcsot ért el: 125 000 dollár fölé emelkedett az árfolyam

A Bitcoin története során először lépte át a 125 000 dolláros szintet, ezzel új történelmi csúcsot állított fel a 17 éves kriptovaluta.
2025. 10. 05. 18:00
Megosztás:

Fordulat a személyi hiteleknél – alig van már 10 százalék feletti kamat

Fordulóponthoz érkezett a hitelpiac: a személyi kölcsönök kamatait sorra mérséklik a bankok. Gergely Péter, a BiztosDöntés.hu pénzügyi szakértője szerint várható volt a trendforduló, hiszen a tavaszi kamatemelkedés után júliustól láthatóan megindult a csökkenés. Ma már szinte minden nagybank 10 százalék körüli kamattal kínálja maga top ajánlatát, és nem csak nagy összegekre.
2025. 10. 05. 17:00
Megosztás:

Újabb milliárdos született Magyarországon

Több mint 1,5 milliárd forintot nyert egy szerencsés játékos az Ötöslottón. Idén ez a harmadik telitalálat az ország legismertebb lottójátékán. Nemcsak az Ötöslottón, hanem a Jokeren is telitalálat született, a szerencsés nyertes majdnem 42 millió forinttal gazdagodott.
2025. 10. 05. 16:00
Megosztás:

Az EU meghosszabbította a külföldön folytatott orosz destabilizáló intézkedésekre válaszul hozott szankcióit

Meghosszabbította az Európai Unió egy évvel, 2026. október 9-ig azokat a szankciókat, amelyeket azokkal szemben hozott, akik felelősök Oroszország "külföldi destabilizáló intézkedéseiért" - közölte Brüsszelben pénteken az uniós tagországok Tanácsa, amely a "folytatódó orosz hibrid tevékenységekkel" indokolta döntését.
2025. 10. 05. 15:00
Megosztás:

Bitcoin hírek: belső vihar a Bitcoin fejlesztői között a Core v30 változása kapcsán

A Bitcoin közösség ismét komoly belső konfliktussal néz szembe: a legújabb Bitcoin Core v30 frissítés komoly megosztottságot idézett elő a fejlesztők körében. A vitatott pont az OP_RETURN mező korlátozásának eltörlése – egy technikai módosítás, ami ideológiai törésvonalakat hozott a felszínre. Vajon a Bitcoin a szabad tranzakciók hálózata marad, vagy egy jobban szabályozott monetáris rendszer irányába mozdul el?
2025. 10. 05. 14:00
Megosztás:

Új korszak kezdődik a Solana blokkláncon: a Voidify és a Tornado Cash összefog a DeFi anonimitásért

A blokklánc világában egyre nagyobb figyelem irányul a felhasználói adatvédelemre. A Voidify és a hírhedt Tornado Cash új szövetsége most forradalmasíthatja a Solana ökoszisztémáját. A nemrég bejelentett Proposal 64 keretében megvalósuló együttműködés célja: a Tornado Cash által kínált szintű adatvédelmi funkciók bevezetése a Solana hálózaton. Ez a lépés nemcsak technológiai, hanem piaci szinten is komoly változásokat vetít előre.
2025. 10. 05. 13:00
Megosztás:

Megnyílt a Budapest-Belgrád vasútvonal teljes szerbiai szakasza

Megnyitották a Budapest-Belgrád vasútvonal teljes szerbiai szakaszát pénteken, az első Belgrád és Szabadka közötti járaton Aleksandar Vucic szerb elnök is fenn volt.
2025. 10. 05. 12:00
Megosztás:

Tüntetéseket tartottak Londonban

Palesztinpárti tüntetéseket tartottak szombaton Londonban, annak ellenére, hogy a rendőrség és a belügyminisztérium a manchesteri zsinagógánál elkövetett terrortámadás miatt a demonstrációk felfüggesztését kérte a szervezőktől. A szombati tüntetéseken jóval kevesebben vettek részt, mint az elmúlt hetek hasonló, gyakran többszázezres megmozdulásain, de a Scotland Yard több mint négyszáz embert őrizetbe vett.
2025. 10. 05. 11:00
Megosztás:

A KIA új, elektromos modell gyártását kezdte meg zsolnai üzemében

A KIA új, elektromos modell gyártását kezdte meg a szlovákiai Zsolnán, a tisztán elektromos EV4 gyártására az elmúlt év során 108 millió eurós beruházással készítette fel európai üzemét a dél-koreai autógyártó.
2025. 10. 05. 09:00
Megosztás:

Csökkenő forgalomban erősödött a BUX a héten

Csökkenő forgalomban erősödött a Budapesti Értéktőzsde (BÉT) részvényindexe a héten, pénteken a BUX 100 462,96 ponton zárt, 1255,17 ponttal, 1,27 százalékkal magasabban, mint egy héttel korábban.
2025. 10. 05. 08:00
Megosztás:

Országos közlekedésbiztonsági ellenőrzést tart a rendőrség a jövő héten

Országos közlekedésbiztonsági ellenőrzést tart a rendőrség a jövő héten, elsősorban a vezetés közbeni telefonálást és a biztonsági öv használatát ellenőrzik - közölte az Országos Rendőr-főkapitányság a police.hu oldalon pénteken.
2025. 10. 05. 06:00
Megosztás:

Megérkeztek a Közúti Közlekedési Környezetvédelmi Akció eredményei

Négy nagyvárosban - Budapesten, Debrecenben, Győrben és Szegeden - 790 gépjármű állapotát mérték fel idén, a 29. alkalommal megrendezett Közúti Közlekedési Környezetvédelmi Akció keretében szeptember 15. és 19. között - közölte az Építési és Közlekedési Minisztérium (ÉKM) pénteken az MTI-vel.
2025. 10. 05. 05:00
Megosztás:

Enyhén csökkent a FAO élelmiszerár-indexe szeptemberben

Az ENSZ Élelmezésügyi és Mezőgazdasági Szervezetének (FAO) pénteki jelentéseszerint szeptemberben enyhén mérséklődött az élelmiszer-alapanyagok világpiaci mutatója, elsősorban a cukor- és tejtermékek árának visszaesése miatt.
2025. 10. 05. 04:00
Megosztás:

A terveknek megfelelő gazdasági eredményekkel zárta az 2025 első fél évét a Vajda-Papír cégcsoport

A Vajda-Papír cégcsoport sikeres első félévet zárt 2025-ben is: az értékesítés nettó árbevétele 11,8%-kal, az adózás előtti eredmény pedig 17%-kal nőtt az előző év azonos időszakához képest. Az év első hat hónapjában elért 38 milliárd forintos konszolidált árbevétel az egy évvel korábbi 34 milliárd forint után és a tavaly fél évit megközelítő, 4,1 milliárd forint EBITDA a cég hatékonyságnövelő intézkedéseinek, valamint stabil piaci jelenlétének köszönhető. A konszolidált adózás előtti eredmény a 2024 első félévi 3,2 milliárd forintról 3,7 milliárd forintra emelkedett.
2025. 10. 05. 03:00
Megosztás: