Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Februárban vége lehet az alapszámla ingyenességének?

Az alapszámla jelenleg nem csak a szolgáltatások meghatározott körét kínálja ingyen, hanem még számlavezetési díjat sem kell fizetni utána mindaddig, amíg az infláció tartósan 4% alá nem csökken. A novemberi tényadat és az MNB decemberi inflációs előrejelzése alapján ez az időpont hamarabb elérkezhet, mint korábban várták.
2025. 12. 21. 23:00
Megosztás:

A 4 legjobb banki token a stabilcoin-robbanásra építve – a Digitap ($TAP) a legjobb kriptó, amit érdemes megvásárolni 2026-ra

A kriptopiac továbbra is nyomás alatt van, mivel a Bitcoin (BTC) és a vezető altcoinok, mint a SOL, az ETH és az XRP is küzdenek az emelkedő trend fenntartásával. A tartós volatilitás és a szűkülő likviditás csökkenti a spekulatív meggyőződést, ami arra készteti a befektetőket, hogy erősebb fundamentumokkal és valós felhasználási esettel rendelkező eszközöket keressenek.
2025. 12. 21. 22:00
Megosztás:

A gyermekmentő szolgálat 800 hátrányos helyzetű gyermeknek szervezett műsort az Operaházban

A Nemzetközi Gyermekmentő Szolgálat harmincadik alkalommal rendezte meg a Magyar Állami Operaházban karácsonyi gyermekgáláját, amelyen az MBH Bank támogatásával nyolcszáz hátrányos helyzetű gyermek vehetett részt - közölték a szervezők vasárnap az MTI-vel.
2025. 12. 21. 21:00
Megosztás:

120 000 csatlakoztatott tárca és 150 millió eladott token – a Digitap ($TAP) csendben válik az egyik legígéretesebb altcoinná 2026-ra

Miközben a kriptovaluta-piac egésze fokozott volatilitást mutat, a felszín alatt valami igazán érdekes történik csendben.
2025. 12. 21. 20:00
Megosztás:

A karácsonyi bevásárlásoknál is jelentős segítség az árréscsökkentés

Az indokolatlan áremelések miatt bevezetett árréscsökkentés a karácsonyi bevásárlások során is kézzelfogható segítséget jelent a családok és a nyugdíjasok számára. Az intézkedés hatására a családok jelentős összeget, több ezer forintot spórolhatnak ünnepi bevásárlásaik során. A decembertől újonnan bevont termékek ára átlagosan 25 százalékkal, a korábban érintett élelmiszereké 20 százalékkal csökkent - áll az NGM friss anyagában.
2025. 12. 21. 19:00
Megosztás:

Ezrek ünnepelték Stonehenge ősi köveinél a téli napfordulót

Ezrek ünnepelték vasárnap a téli napfordulót a délnyugat-angliai Stonehenge ősi köveinél.
2025. 12. 21. 18:00
Megosztás:

Használd a CreditBlockchain felhőbányászatot a Bitcoin bika- és medvepiacain való navigáláshoz, és stabil napi hozamok rögzítéséhez

Elege van abból, hogy folyamatosan a Bitcoin csúcsértékeit és mélypontjait találgatja?
2025. 12. 21. 16:15
Megosztás:

Kezdődik a csillagászati tél

Vasárnap kezdődik a csillagászati tél, a napforduló 16 óra 3 perckor lesz - írta a HungaroMet Zrt. a honlapján vasárnap.
2025. 12. 21. 16:00
Megosztás:

ÉKM: igenis van megállapodás a fuvarozókkal

Az Építési és Közlekedési Minisztérium (ÉKM) pénteken hét fuvarozói szervezet képviselőivel írt alá megállapodást; minden fuvarozói szervezettel megegyezett, egy szervezet kivételével - közölte a tárca vasárnap az MTI-vel.
2025. 12. 21. 15:00
Megosztás:

Hogyan lesznek nyitva a kormányablakok az ünnepi időszakban?

Korlátozott lesz az ügyintézés a kormányablakokban és kormányhivatalokban december 24-től január 5-ig. Az év végi hivatali szünet ellenére a két ünnep közötti munkanapokon, vagyis december 29-31-ig országszerte 22 kormányablak és a Központi Kormányablak várja az ügyfeleket 8 és 12 óra között.
2025. 12. 21. 13:00
Megosztás:

Sikeres évet zár a Budapesti Kereskedelmi és Iparkamara

A Budapesti Kereskedelmi és Iparkamara (BKIK) tagságának képviselői december 16-án kedden küldöttgyűlésen értékelték a szervezet 2025. évi munkáját, teljesítményét. A jelenlévők szavaztak a köztesület jövő évi költségvetéséről, szakmai programjáról és módosul az alapszabály is.
2025. 12. 21. 12:00
Megosztás:

7 milliárdot nyerhet bárki a következő 11 napban – itt a Szilveszteri Szuperlottó

Élesbe fordul a szilveszteri extra nyereményjáték: a december 20-án estétől megvásárolt Ötöslottó szelvények már érvényesek lesznek a Szerencsejáték Zrt. különleges Szilveszteri Szuperlottó nyereményjátékára. A fogadási idő is hosszabb lesz, aki telitalálatot ér el 7 milliárd forinttal gazdagodhat mindössze 400 forintért cserébe.
2025. 12. 21. 11:00
Megosztás:

Erősödött az MG autómárka Európa piacán az idén

Az MG Motor elérte az éves 300 ezer darabos értékesítést decemberre az Egyesült Királyság és Európa piacán, történelme során először, a növekedés közel 30 százalékos 2024 azonos időszakához képest, amikor mintegy 233 ezer darabos eladást regisztráltak - tájékoztatta az MG Motor Hungary az MTI-t pénteken közleményben.
2025. 12. 21. 10:00
Megosztás:

Növekvő forgalom mellett emelkedett a BUX a héten

Növekvő forgalom mellett emelkedett a Budapesti Értéktőzsde (BÉT) részvényindexe a héten, pénteken a BUX 110 405,74 ponton zárt, 0,73 százalékkal magasabban, mint egy héttel korábban.
2025. 12. 21. 09:00
Megosztás:

Bejgli, töltött káposzta és online csalások – a szaporodó kiberbűnözés miatt ez lehet sokaknak a karácsonyi menü

Együtt a család, a fa alatt az ajándékok, mindenki készen áll az ünneplésre. A karácsony a meghittséget hozza el, azonban ha nem figyelünk oda, akkor bosszankodással is telhetnek az ünnepek. Az év végi ünnepi időszak az egyik legtermékenyebb szezonja az online- és kiberbűnözőknek. Az ünnepek előtt megszaporodnak az internetes vásárlások és forgalom, azonban lankad a figyelem, hiszen igyekszünk minél hamarabb beszerezni az ajándékokat. Az elmúlt években egyre több az online rendelés, és ezt bizony kihasználják a csalók. A KPMG csapata hozott néhány egyszerű ünnepi tippet, amiket ha valóban betartunk – nem úgy, mint az újévi fogadalmainkat –, akkor könnyen kiszűrhetjük, hogy kik és hogyan akarják megkeseríteni az év legszebb időszakát.
2025. 12. 21. 07:00
Megosztás:

Vlagyimir Putyin: Európa elveszíti pozícióját, ha nem működik együtt Oroszországgal

Európa fokozatosan el fogja veszíteni pozícióját, eltűnik, ha nem működik együtt Oroszországgal - vélekedett Vlagyimir Putyin orosz elnök pénteki moszkvai évértékelő sajtótájékoztatóján.
2025. 12. 21. 06:00
Megosztás:

MÁV: utastájékoztató kijelzőket helyeztek ki a kelenföldi peronoknál

A kelenföldi állomás mind az öt peronján nagy felületű utastájékoztató kijelzőket helyeztek el - erről a MÁV-csoport vezérigazgatója a Facebook-oldalán számolt be szombaton.
2025. 12. 21. 05:00
Megosztás:

Minden jelentkező nyert a közvilágítási pályázaton

Megszülettek az első támogatási döntések a Jedlik Ányos Energetikai Programban, több mint 1200 nyertese van a valaha volt legnagyobb ágazati programcsomagnak - közölte szombaton Facebook-oldalán az Energiaügyi Minisztérium (EM).
2025. 12. 21. 04:00
Megosztás:

7 milliárdért megy a játék a következő 11 napban – itt a Szilveszteri Szuperlottó

Élesbe fordul a szilveszteri extra nyereményjáték: a december 20-án estétől megvásárolt Ötöslottó szelvények már érvényesek lesznek a Szerencsejáték Zrt. különleges Szilveszteri Szuperlottó nyereményjátékára. A fogadási idő is hosszabb lesz, aki telitalálatot ér el 7 milliárd forinttal gazdagodhat mindössze 400 forintért cserébe.
2025. 12. 21. 03:00
Megosztás:

Sok nyugdíjas nem tudja sajnos: vissza kell fizetni a megkapott nyugdíjat!

A jelenleg hatályos jogszabályok egyértelműen rögzítik, mely esetekben merül fel az állami nyugdíj visszafizetésének kötelezettsége. A társadalombiztosítási nyugellátásról szóló, 1997. évi LXXXI. törvény részletesen rendelkezik arról is, hogy milyen körülmények között kell a már folyósított nyugdíjösszeget visszatéríteni. Az alábbiakban bemutatjuk a vonatkozó jogszabályi előírásokat.
2025. 12. 21. 01:00
Megosztás: