Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Bitcoin újabb hullámvölgyben: elesett a 93 000 dolláros szint, de meddig tart az esés?

A Bitcoin árfolyama ismét komoly nyomás alá került, és áttörte a 93 000 dolláros lélektani határt, ami sokakban felidézi a korábbi négyéves ciklusok mélyrepüléseit. Vajon ez most is egy hosszabb medvepiac kezdete, vagy csupán egy egészséges korrekció egy újabb bikafutam előtt? Elemzők szerint a helyzet komplex, de nem feltétlenül borús.
2025. 11. 18. 01:30
Megosztás:

Hivatalos! Nyugdíj korhatár 2026. januártól

Mi az igazság a „2026-os nagy nyugdíjforradalomról"? Az elmúlt hetekben tele volt a sajtó azzal, hogy „2026. januártól megszűnik a 65 éves nyugdíjkorhatár, mindenki szabadon dönthet, mikor megy nyugdíjba”. Néhány nagyobb portál is átvette ezt a hírt – majd gyorsan visszavonta, mert kiderült: álhír volt. A Nemzetgazdasági Minisztérium hivatalosan is cáfolta, hogy megszűnne a 65 éves korhatár, vagy hogy gyökeresen átalakulna a rendszer.
2025. 11. 18. 01:00
Megosztás:

Átalakítja vezetői teljesítményjavadalmazási programját az MBH Bank

Az MBH Bank átalakítja vezetői teljesítményjavadalmazási rendszerét, amelynek keretében a hitelintézet közgyűlési döntés alapján, a piaci sztenderdeknek megfelelően részvényalapú ösztönzési programot indított.
2025. 11. 18. 00:30
Megosztás:

Kommentár a Kormány és a Kereskedelmi és Iparkamara mai megállapodásához

A Niveus a 11 pontból két intézkedést emelt ki, amelyek érdemben befolyásolhatják a vállalkozások adózását: a kisvállalati adóra jogosultak körének kiszélesítését, valamint a kiskereskedelmi adó határsávjainak megemelését, miközben a kulcsok változatlanok maradnak — ez mintegy 3500 cégnek jelenthet adócsökkentést. A fennmaradó kilenc ponthoz a Niveus rövid, egy­mondatos megjegyzéseket fűzött.
2025. 11. 17. 23:30
Megosztás:

Lássuk a következő 100-szorozó esélyesek: Digitap ($TAP), Cardano és Litecoin

A tapasztalt befektetők jól tudják, hogy egy 100-szoros megtérülés (100x ROI) elérése jellemzően azt kívánja meg, hogy a projektekbe még korai fázisban, a mainstream ismertség előtt fektessenek be.
2025. 11. 17. 23:00
Megosztás:

Ha az XRP is 1 775%-ot emelkedik, mint a Zcash – Itt köthet ki az árfolyama

Az XRP hívei kíváncsian figyelik, vajon a token képes-e hasonló parabolikus árfolyam-emelkedésre, mint amit a közelmúltban a <a href="https://coinmarketcap.com/currencies/zcash/" target="_blank">Zcash (ZEC)</a> produkált. Miközben az XRP az elmúlt hónap során közel 20%-ot esett, a ZEC szembement az általános piaci trenddel, és az év egyik leglátványosabb raliját valósította meg.
2025. 11. 17. 22:00
Megosztás:

Michael Saylor: „Tarts ki az életedért”, miközben a Bitcoin esése 92 000 dollárig mélyül

Michael Saylor egy egyszerű, mégis szimbolikus üzenetet küldött a Bitcoin-közösségnek a mai, súlyos piaci eladási hullám közepette.
2025. 11. 17. 21:00
Megosztás:

Magyarország nem kér a műhúsból

Magyarország nem kér a műhúsból - közölte az Agrárminisztérium (AM) hétfőn az MTI-vel.
2025. 11. 17. 20:30
Megosztás:

A Digitap ($TAP) lesz a következő kriptórobbanás? – Mélyreható tokenelemzés

2026 kevesebb mint két hónapnyira van, és a világ egyre inkább eltávolodik a hagyományos bankolási módszerektől. A Z generáció és a milleniálok több mint 70%-a már mobilbanki alkalmazásokat használ pénzügyei kezelésére.
2025. 11. 17. 20:00
Megosztás:

A Bitcoin ára 95 000 alá esett; Miért vonzotta a PEPPER Mining platform a felhasználókat a trenddel szemben?

A Bitcoin ára nemrég 95 000 dollár alá esett, ami piaci pánikot szított és a rövid lejáratú spekulatív alapok gyors kivonulását idézte elő. A folyamatos piaci volatilitás közepette azonban a PEPPER Mining platform egyre nagyobb felhasználói figyelmet keltett. Ez stabil, átlátható és kiszámítható profitmodelljének köszönhető, amely a spot és származtatott piacoktól eltérő „stabil részvételi módszert” kínál a befektetőknek.
2025. 11. 17. 19:40
Megosztás:

Az OKSZ a SZÉP-kártya közterheinek csökkentését szorgalmazza

Az Országos Kereskedelmi Szövetség üdvözli a SZÉP-kártya felhasználhatóságának kiterjesztését a hideg élelmiszerek vásárlására, mert az egyszerre segítheti a lakosságot az alapvető élelmiszerek beszerzésében és a kiskereskedelmi forgalom élénkítését, ugyanakkor a SZÉP-kártyás hidegélelmiszer-vásárlások maximum 3,6 százalékos tranzakciós díjának mérséklését javasolja - közölte a szövetség hétfőn az MTI-vel.
2025. 11. 17. 19:30
Megosztás:

Megkezdődött az országos mezőgazdasági összeírás

Megkezdődött az egyéni gazdaságok idei mezőgazdasági összeírása, amelyben országszerte több mint 21 ezer gazdaság vesz részt; az adatszolgáltatást kormányrendelet írja elő, a válaszadás kötelező - tájékoztatta a Központi Statisztikai Hivatal (KSH) közleményében az MTI-t.
2025. 11. 17. 18:30
Megosztás:

Megújította vezető testületeit az MBH Bank

Az MBH Bank Nyrt. hétfői rendkívüli közgyűlésén megválasztották a pénzintézet vezető testületeinek tagjait, a közgyűlés döntése értelmében a hitelintézet elnök-vezérigazgatói pozícióját 2030-ig továbbra is Barna Zsolt tölti be, miközben tapasztalt szakemberek bevonásával tovább erősödnek a bank vezető testületei - tájékoztatta a pénzintézet az MTI-t.
2025. 11. 17. 17:30
Megosztás:

Adathalász hirdetések lehettek a Google platformján, a GVH megvizsgálja

Versenyfelügyeleti eljárást indított a Gazdasági Versenyhivatal (GVH) a Google-lal szemben. A GVH gyanúja szerint a Google Ireland Limited (Google) a Google Ads hirdetési platformján nem ellenőrizte megfelelően az adathalász hirdetéseket, ezért azok fizetett tartalomként, illetve a Google kereső a találati listájának elején jelenhettek meg. Mindez a versenyhatóság szerint hozzájárulhatott ahhoz, hogy a fogyasztók kockázatos weboldalakra kerüljenek vagy kicsalják tőlük a banki belépési adataikat.
2025. 11. 17. 17:00
Megosztás:

ALTEO III. negyedévi gyorsjelentés: dinamikusan növekvő árbevétel és folytatódó stratégiai építkezés

A Budapesti Értéktőzsde (BÉT) prémium kategóriájában jegyzett ALTEO Nyrt. árbevétele 16 százalékkal bővült az év első kilenc hónapjában, amelyet szinte valamennyi üzleti terület két számjegyű növekedéssel támogatott.
2025. 11. 17. 16:30
Megosztás:

A Semmelweis Egyetem Közép-Európa legjobb egyeteme

A Semmelweis Egyetem (SE) Közép-Európa legjobb egyeteme, a cél pedig az, hogy az elkövetkező években Európa és a világ egyik legjobb egyeteme legyen a budapesti orvosegyetem - hangoztatta a kulturális és innovációs miniszter hétfőn a Városmajori Szív- és Érgyógyászati Klinika új Diagnosztikai és Terápiás Központjának avatásán.
2025. 11. 17. 16:00
Megosztás:

A használt ingatlanoké a lakáshitelpiac – ám az Otthon Start javíthat a helyzeten

Az idei év első kilenc hónapjában folyósított lakáshitelek összegének több mint 77 százalékát használt lakás vásárlására fordították az adósok, a szerződések számánál pedig még magasabb lehet ez az arány – hívja fel a figyelmet Gergely Péter, a BiztosDöntés.hu pénzügyi szakértője. Az Otthon Start Program új szerződéseivel ugyanakkor nőhet az új ingatlanok aránya a friss szerződéseken belül.
2025. 11. 17. 15:30
Megosztás:

Stabilcoin-válság réme fenyegeti Európát – figyelmeztet az EKB

Az Európai Központi Bank (EKB) újabb, a kriptovaluták világából eredő pénzügyi kockázatra figyelmeztet. Olaf Sleijpen, a holland jegybank kormányzója szerint egy hirtelen bekövetkező stabilcoin-visszaváltási hullám megrázhatja Európa gazdaságát, és rákényszerítheti az EKB-t monetáris politikája újragondolására. Mit is jelent ez pontosan, és miért kellene figyelnünk a digitális dollárhoz kötött tokenekre?
2025. 11. 17. 15:00
Megosztás:

Árdrágító és inflációnövelő hatása lehetne a csomagolásokat terhelő EPR-díjak további emelésének

A hazai gyártó, forgalmazó és kereskedő vállalkozások arra hívják fel a figyelmet, hogy a legkésőbb november 30-ig kihirdetendő 2026. évi, csomagolásokat és termékeket terhelő kiterjesztett gyártói felelősségi (EPR) díjak esetleges újabb emelésének érezhető inflációnövelő hatása lehet.
2025. 11. 17. 14:30
Megosztás:

Új számlák, új díjak: így alakítják át kínálatukat a bankok a bankszámlastop idején

A 2026 közepéig érvényben lévő bankszámlastop befagyasztotta a meglévő lakossági bankszámlák díjait, miközben az elmúlt időszakban több pénzintézet is új számlacsomagokat vezetett be, amelyekre nem vonatkozik a hatályos korlátozás. A money.hu elemzése szerint a Raiffeisen, az MBH Duna Bank, az OTP és a MagNet Bank is teljesen átalakította számlacsomag-kínálatát - a régi csomagok megszűntek, az újak pedig sok esetben magasabb havi költséggel és szigorúbb feltételekkel érhetők el.
2025. 11. 17. 14:00
Megosztás: