Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

A két ünnep között jön a második nagy roham az áruházakban

A karácsonyt követő napokban az üzletek szinte az ünnepek előtti forgalmat bonyolítják, ilyenkor ugyanis tömegével cserélik ki az emberek az ajándékba kapott ruhákat, termékeket. Vevőkből is sok van ezekben a napokban, hiszen az üzletek is újabb akciókba kezdenek, hogy kisöpörjék meglévő árukészletüket. Nem véletlen, hogy a 0 százalékos THM-mel hirdetett áruhitel-ajánlatok is sokszor csak az év végig szólnak – hívja fel a figyelmet a BiztosDöntés.hu pénzügyi szakértője.
2025. 12. 27. 10:00
Megosztás:

Németország korábbi oktatási minisztere az NKE-nek adományozza könyvtárát

Klaus von Dohnányi, Hamburg korábbi polgármestere, Németország korábbi oktatási minisztere, külügyi és gazdasági államtitkára a Nemzeti Közszolgálati Egyetemnek (NKE) ajándékozza könyvtárát.
2025. 12. 27. 09:00
Megosztás:

Nem szűnik meg, csak szabályozottabb lesz a BNPL

Szigorodnak a halasztott fizetés szabályai 2026. november 20-tól, amikor a fogyasztói hitelekről szóló törvény (Fhtv.) módosítása életbe lép.
2025. 12. 27. 08:00
Megosztás:

Vlagyimir Putyin: többszörösére nőtt az orosz fegyvergyártás a háború kezdete óta

Többszörösére nőtt a fegyverek és haditechnikai eszközök gyártása Oroszországban 2022 óta; csak a fegyver- és lőszerek beszállítása több mint 22-szeresére emelkedett - jelentette ki Vlagyimir Putyin orosz elnök egy, az állami fegyverkezési programról pénteken Moszkvában megtarott tanácskozáson.
2025. 12. 27. 07:00
Megosztás:

Az amerikai Függetlenségi nyilatkozat elfogadásának közelgő 250. évfordulóját köszöntik a szegedi újévi koncerten

Az Amerikai Egyesült Államok függetlenségi nyilatkozata elfogadásának közelgő 250. évfordulóját köszönti január 5-i újévi koncertjén a Szegedi Szimfonikus Zenekar - közölte Gyüdi Sándor igazgató az MTI-vel.
2025. 12. 27. 06:00
Megosztás:

Monero XMR kriptovaluta árfolyam előrejelzés 2026

Monero újra reflektorfényben: áttörés készül a többéves csúcsok felé?
2025. 12. 27. 04:00
Megosztás:

BlackRock kripto tranzakciók: 114 millió dollár értékű Bitcoin és Ethereum került a Coinbase-re

A világ legnagyobb vagyonkezelője, a BlackRock ismét komoly mozgásokat hajtott végre a kriptovaluták piacán. December 26-án több mint 114 millió dollár értékben utaltak át Bitcoint és Ethereumot a Coinbase Prime platformra, ami újabb jele annak, hogy az intézményi érdeklődés töretlen a digitális eszközök iránt. Bár hivatalos nyilatkozat nem érkezett, a lépés jól illeszkedik a BlackRock ETF-kezelési stratégiájába.
2025. 12. 27. 03:00
Megosztás:

Tízmilliók lakóhelyére adtak ki téli riasztást az Egyesült Államokban

Az Egyesült Államokban 60 millió ember lakóhelyére adtak ki rendkívüli téli időjárás miatt figyelmeztetést, vagy riasztást pénteken, északkeleten már több mint ezer légijáratot töröltek.
2025. 12. 27. 02:00
Megosztás:

Nyugdíjba vonuláskor átlag 232.000 Ft-ot veszítünk havonta

A tényadatok alapján továbbra is jelentős különbség van az aktív korban elérhető keresetek és az öregségi nyugdíjak között. Az idei év első három negyedévében az átlagos nettó kereset 476 ezer forint volt, míg az öregségi nyugdíjak átlagos összege az év első kilenc hónapjában alig több mint 244 ezer forintot tett ki.
2025. 12. 27. 01:00
Megosztás:

Az Egyesült Államokban tízmilliók lakóhelyére adtak ki téli riasztást

Az Egyesült Államokban 60 millió ember lakóhelyére adtak ki rendkívüli téli időjárás miatt figyelmeztetést, vagy riasztást pénteken, északkeleten már több mint ezer légijáratot töröltek.
2025. 12. 27. 00:05
Megosztás:

Bitcoin (BTC) opciós lejárat felerősíti a volatilitást

A Bitcoin árfolyama ismét hektikusan mozog: december 26-án rövid időre 1,63%-ot emelkedett, 89 100 dollár fölé, majd visszacsúszott 88 500 dollár körüli szintekre. A hirtelen kilengések hátterében a pénteki, közel 28 milliárd dolláros Bitcoin opciós lejárat állhat, amely hagyományosan erős piaci mozgásokat vált ki.
2025. 12. 26. 23:00
Megosztás:

Kreml: Moszkva és Washington megállapodott a tárgyalások folytatásában

A Kreml és a Fehér Ház megállapodott az ukrajnai rendezési tárgyalások folytatásáról – jelentette be Dmitrij Peszkov, az orosz elnök sajtótitkára újságírók előtt pénteken Moszkvában.
2025. 12. 26. 22:00
Megosztás:

A Solana 124 dolláron vs. Digitap ($TAP): Miért fontosabbak a banki infrastruktúrák, mint a tranzakciós sebesség 2026-ban?

A Solana jelenleg 124 dollár körül forog, de a banki infrastruktúrák hatása 2026-ban sokkal jelentősebb lehet. A Digitap ($TAP) a fizetési elszámolásra, kártyás fizetésre és fiat-hozzáférésre összpontosít.
2025. 12. 26. 20:00
Megosztás:

A következő másfél évtizedben az Egyesült Államok marad a világ legnagyobb gazdasága

Londoni pénzügyi elemzők szerint a következő másfél évtizedben várhatóan az Egyesült Államok marad a világ legnagyobb gazdasága.
2025. 12. 26. 18:00
Megosztás:

A lengyelek leginkább az egészségügy helyzete miatt aggódnak

A legnagyobb aggodalmat az egészségügyi ellátás elérhetősége kelti a lengyelek körében a 2026-os évre vonatkozóan – derült ki a Wirtualna Polska hírportál által pénteken közzétett felmérésből.
2025. 12. 26. 17:00
Megosztás:

Rekordot döntött az idén kötött brit fegyverexport-szerződések értéke

Rekordot döntött az idén kötött új brit fegyverexport-szerződések értéke.
2025. 12. 26. 16:00
Megosztás:

Újabb XRP árrobbanás jöhet 2026-ban? – Elemző szerint közeledik a következő nagy kitörés

Az XRP, a Ripple által támogatott kriptovaluta ismét a reflektorfénybe került, miután egy ismert elemző, CryptoBull újabb jelentős árfolyam-emelkedést vetít előre. Az elemzés szerint az XRP ismét ugyanabban a klasszikus mintában mozog, amely korábban is hatalmas árrobbanásokat eredményezett. De vajon tényleg küszöbön áll a következő nagy ralira való kitörés?
2025. 12. 26. 15:00
Megosztás:

Litván ultimátum a kriptovaluta szolgáltatóknak: Engedély vagy szankció 2025. december 31-ig!

Litvánia határozott lépést tett a kriptoszektor szabályozása felé: a balti állam központi bankja figyelmeztette a hazai kriptoeszköz-szolgáltatókat (CASP), hogy 2025. december 31-ig engedélyt kell szerezniük a működéshez – ellenkező esetben illegális tevékenységnek minősülhetnek, amely akár büntetőjogi következményekkel is járhat. Az európai MiCA-rendelet betartása immár nem választható – hanem kötelező. Aki lemarad, kimarad.
2025. 12. 26. 13:00
Megosztás:

Előrehozott parlamenti választást tartanak Koszovóban vasárnap

Előrehozott parlamenti választást tartanak vasárnap Koszovóban, azt követően, hogy a kormányzó Önrendelkezés (Vetevendosje) a februári választások után nem tudott kormányt alakítani.
2025. 12. 26. 12:00
Megosztás:

A Bitcoin gyenge pontja: Miért törik meg az árfolyam a 70–80 ezer dolláros sávban?

A Bitcoin árfolyama új történelmi csúcsok közelében jár, mégis rejtett gyengeségeket mutat a piac bizonyos árszintjein. Egy friss elemzés rávilágít arra, hogy a 70 000 és 80 000 dollár közötti zóna továbbra is a BTC egyik leginstabilabb, legkevésbé megtámogatott tartománya – ami kulcsfontosságú lehet a jövőbeli emelkedések vagy korrekciók szempontjából.
2025. 12. 26. 10:00
Megosztás: