Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Őrizetbe vettek Romániában egy volt közlekedési minisztert

Őrizetbe vették kedden Romániában Razvan Cuc volt közlekedési minisztert, aki a korrupcióellenes ügyészség (DNA) szerint bűntársként játszott szerepet egy 1,38 millió lejes (több mint 100 millió forint) vesztegetési ügyben.
2025. 12. 17. 02:00
Megosztás:

Adófizetés a karácsonyi ajándékok után 2025-ben

Így adózz a karácsonyi ajándékok után 2025-ben: a karácsonyi időszakban számos vállalat dönt úgy, hogy ajándékkal köszöni meg munkavállalói vagy üzleti partnerei együttműködését. Az ajándékozás azonban nem minden esetben jár adómentességgel, ezért különösen fontos tisztában lenni az ajándékok adózási szabályaival, amelyek az ajándékozott személyétől és az ajándék értékétől is függenek. A legfontosabb tudnivalókat a Niveus foglalta össze.
2025. 12. 17. 01:00
Megosztás:

London 600 millió font értékben vásárol légvédelmi eszközöket Ukrajnának

A brit kormány 600 millió font (265 milliárd forint) értékben vásárol új, magas technológiájú légvédelmi eszközöket Ukrajnának. A döntést John Healey brit védelmi miniszter jelentette be kedden az ukrajnai védelmi kontaktcsoport virtuális találkozóján.
2025. 12. 17. 00:30
Megosztás:

Varga Mihály: 2027 második felére érhető el fenntartható módon az inflációs cél

A Magyar Nemzeti Bank (MNB) inflációs célja 2027 második felében érhető el fenntartható módon, de a szeptemberi előrejelzéshez képest az idén és jövőre is alacsonyabb lehet az infláció - mondta a Magyar Nemzeti Banki (MNB) elnöke a keddi kamatdöntő ülést követő sajtótájékoztatón.
2025. 12. 16. 23:30
Megosztás:

Kettészakadt a karácsonyi fogyasztás: visszafogott éttermi fogyasztás, rekordhónap a prémium boltoknál

Miközben a vendéglátásban elmarad az év végi fellendülés, a prémium élelmiszerek és ajándékmegoldások iránt soha nem látott kereslet alakult ki – a karácsonyi szezon látványosan megmutatja, hogyan alkalmazkodnak a magyar fogyasztók a tartós költségnyomáshoz.
2025. 12. 16. 23:00
Megosztás:

Meddig emelkedhet a DOGE és az XRP árfolyama 2025 vége előtt? Ünnepi hype övezi a Digitapet – ez lehet a következő 10-szeres altcoin?

Ahogy közeledik 2025 vége, egyre több szó esik a Dogecoin és az XRP árfolyamának esetleges fellendüléséről. Mindkettő gyengélkedik a heti grafikonokon, de olyan ismert influencerek, mint Trader Tardigrade és Ali továbbra is optimisták. Szerintük a Dogecoin és a Ripple továbbra is erős altcoin vásárlási lehetőség, és még az év vége előtt jelentős emelkedés jöhet.
2025. 12. 16. 22:00
Megosztás:

A STRABAG nem vállal felelősséget a saját munkájáért

A STRABAG 2025. december 11-én készre jelentette az M30-as autópályán végzett garanciális munkákat, 2025. december 16-án került sor a javítások műszaki átadás-átvételére a STRABAG, az Építési és Közlekedési Minisztérium (ÉKM) és az autópályát üzemeltető MKIF Zrt. részvételével - közölte az ÉKM kedden az MTI-vel.
2025. 12. 16. 21:30
Megosztás:

Az AutoWallis megkezdi két új kínai prémium márka értékesítését Magyarországon

Az AutoWallis kiskereskedelmi üzletága két új prémium kategóriás kínai autómárkát vezet be a magyar piacra, a NIO és a firefly modelljeit januártól értékesíti az első budapesti márkakereskedés - jelentette be a cég kedden Budapesten.
2025. 12. 16. 21:00
Megosztás:

Importőrök árazási gyakorlata a GVH fókuszában

A Gazdasági Versenyhivatal (GVH) és a Magyar Nemzeti Bank (MNB) közösen vizsgálják, hogy a forint elmúlt hónapokban tapasztalt jelentős erősödése hogyan jelenik meg a magyarországi fogyasztói árakban, így különösen az importból származó termékek, élelmiszerek esetében. A GVH mérlegeli a versenyjogi eszköztárába tartozó eszközök alkalmazását, így indokolt esetben gyorsított ágazati vizsgálatot indíthat az ágazati problémák versenyközpontú értékelése érdekében, vagy akár versenyfelügyeleti eljárást is indíthat érintett piaci szereplőkkel szemben.
2025. 12. 16. 20:30
Megosztás:

A TRON megtorpan 0,28 dollár közelében, miközben a Digitap ($TAP) a 2026-os év legjobb kripto előértékesítésének számít

A kriptopiac nyomás alatt maradt a hét elején. Az árak oldalaznak. A befektetői bizalom továbbra is alacsony. Sok nagyobb token küzd azzal, hogy áttörje a kulcsszinteket. A TRON (TRX) is ezek közé tartozik. A token 0,28 dollár körül forog, és nem tud lendületet venni. Ilyen környezetben a tőke a biztonságot, a logikát és a valós felhasználási értéket keresi.
2025. 12. 16. 20:00
Megosztás:

Gyengült a forint kedd estére

Gyengült a forint a főbb devizákkal szemben kedden kora estére a bankközi devizapiacon reggelhez képest.
2025. 12. 16. 19:30
Megosztás:

Jön a Szilveszteri Szuperlottó 7 milliárd forintos giganyereménnyel

kár egy lottószelvény megvásárlásával, azaz 400 forintért cserébe nyerhet 7 milliárd forintot az újév első órájában bárki, aki december 20-a után vásárol ötöslottószelvényt, vagy van erre az időszakra szóló aktív 5 hetes szelvénye. A Szerencsejáték Zrt. ugyanis az Ötöslottóra építve különleges nyereményjátékot hirdet meg 2025 végére. A Szilveszteri Szuperlottó 7 milliárd forintra emeli meg az Ötöslottó aktuális főnyereményét, és a játék miatt hosszabb lesz a fogadási idő is.
2025. 12. 16. 19:00
Megosztás:

Már lehet jelentkezni a 2026-os hungarikum pályázatokra

Nemzeti értékeink megőrzése, gyűjtése és népszerűsítése kiemelt feladata az agrártárcának. Ezért már tizenötödik alkalommal hirdeti meg a hungarikum pályázatot az Agrárminisztérium és a Hungarikum Bizottság. A 2026. évi kiírás 650 millió forintos keretösszeggel három célterületet támogat - közölte Nagy István agrárminiszter közösségi oldalán kedden.
2025. 12. 16. 18:30
Megosztás:

Horvátországban terjeszkedik a Hunguest Hotels

Az OPUS GLOBAL-hoz tartozó Hunguest Hotels szállodalánc üzemeltetheti a horvátországi Opatijában található négycsillagos Hotel Miramart - tájékoztatta a társaság kedden az MTI-t.
2025. 12. 16. 18:00
Megosztás:

Aki jó a kvízjátékban, az jó az üzleti életben is

Első pillantásra meglepőnek tűnhet az állítás, hogy a kvízjátékokban való jártasság és az üzleti siker között valódi kapcsolat van.
2025. 12. 16. 17:00
Megosztás:

A Bitget arany-, deviza- és árupiaci kereskedést indít kriptófelhasználók számára

A Bitget, a világ legnagyobb Univerzális Tőzsdéje (UEX) ma bejelentette a Bitget TradFi privát béta verziójának elindítását. Ez az új, több piacot összekapcsoló funkció közvetlen hozzáférést biztosít a kriptófelhasználóknak a globális deviza-, fém-, árupiaci, index- és részvény CFD-piacokhoz, USDT fedezet használatával. A kiválasztott felhasználók már tesztelhetik az új funkciót korlátozott, korai hozzáféréssel.
2025. 12. 16. 16:30
Megosztás:

Az EU egyetlen molekula energiát sem fog soha többé importálni Oroszországból

Az Európai Unió azon döntése, hogy megtiltja az orosz gáz importját, történelmi jelentőségű, ugyanis egyetlen egy molekula energiát sem fog soha többé importálni Oroszországból - jelentette ki Dan Jorgensen, az Európai Bizottság energiaügyekért felelős biztosa Strasbourgban kedden.
2025. 12. 16. 16:00
Megosztás:

Sikeresen zárult az MBH részvényértékesítése

Közel 12 ezer befektető vált részvényessé az MBH Bankban, miután volumenét tekintve az elmúlt 25 év legnagyobb hazai részvényértékesítési tranzakcióját hajtotta végre a hitelintézet a Budapesti Értéktőzsdén. Jelentős túlkereslet mellett, összesen mintegy 107 milliárd forint értékű igény érkezett - közölte a bank hétfőn az MTI-vel.
2025. 12. 16. 15:30
Megosztás:

4,5 millió négyzetméteren újultak meg idén a hazai gyorsforgalmi utak

Véget értek az idei útfelújítási munkálatok az MKIF Magyar Koncessziós Infrastruktúra Fejlesztő Zrt. által üzemeltetett gyorsforgalmi utakon. 2025-ben az MKIF Zrt. által kezelt főpálya 24 százaléka, 4,5 millió négyzetméter kapott új burkolatot, ahol szükség volt rá, a mélyebb szerkezeti részeket, vagyis a kötő és az alapréteget is cserélték - jelentette be az MTI-nek küldött közleményében kedden a társaság.
2025. 12. 16. 15:00
Megosztás:

Milliárdos budai villa és 20 ezres vidéki ház

A Duna House éves tranzakciós adatai szerint a 2025-ös ingatlanpiacot a főváros és a vidék közötti különbségek növekedése, valamint az Otthon Start Program hatására erősen átalakuló vevői és eladói motivációk jellemezték. Országosan az átlagos eladási ár 55 millió forint, az átlagos négyzetméterár pedig 736 ezer Ft/m² volt. Budapesten ennél jóval magasabb értékek a jellemzőek: egy ingatlanért átlagosan 82 millió forintot fizettek, a négyzetméterár pedig 1,2 millió Ft/m²-re emelkedett.
2025. 12. 16. 14:30
Megosztás: