Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

A kormányhivatal megkezdte a csomagküldő szolgálatok ellenőrzését

A fővárosi kormányhivatal - szerdán az MTI-hez eljuttatott közleménye szerint - a vásárlók érdekében megkezdte a csomagküldő szolgálatok ellenőrzését.
2025. 12. 17. 19:30
Megosztás:

Átadták a Kerékpárosbarát település és a Kerékpárosbarát munkahely díjakat

Átadták a Kerékpárosbarát település és a Kerékpárosbarát munkahely díjakat szerdán Budapesten; a címet tíz település és tíz vállalat, illetve közintézmény kapta meg.
2025. 12. 17. 19:00
Megosztás:

2026 lehet az év, amikor a kriptó végleg belép a fősodorba?

A kriptopiac az elmúlt hónapokban látványos visszaesést szenvedett el: az összkapitalizáció október óta 4,2 billió dollárról 2,9 billióra csökkent, ami sok befektetőben újraélesztette a bizonytalanságot. Ugyanakkor 2025-ben több olyan strukturális változás történt, amely néhány éve még elképzelhetetlen lett volna, és ezek együtt akár megalapozhatják azt, hogy a kriptovaluták 2026-ban valóban kilépjenek a rétegeszköz szerepből.
2025. 12. 17. 18:30
Megosztás:

Biztató jel, de még nem trend - Építőipar

Szeptemberben és októberben látványosan megugrott az építőipar teljesítménye, ám a vállalkozói adatok alapján ez egyelőre még nem trend. A működő cégek száma tovább csökkent, a piac feszes maradt, miközben az egyéni vállalkozóknál egyértelmű átrendeződés indult el.
2025. 12. 17. 17:30
Megosztás:

Modernizáció, tőkebeáramlás és strukturális változások formálják a következő évet

A Colliers közzétette legújabb jelentését „CEE-6: Highlights 2025 & Predictions 2026” címmel, amely áttekintést ad a gazdasági és ingatlanpiaci trendekről Bulgáriában, Csehországban, Magyarországon, Lengyelországban, Romániában és Szlovákiában. A tanulmány szerint 2025-ben mérsékelt gazdasági fellendülés, csökkenő infláció és egyre hangsúlyosabb stratégiai fókusz jellemezte a fenntarthatóság területét – miközben az ingatlanpiacokat a modernizáció, az új irodakínálat szűkössége, az erős logisztikai kereslet és a retail parkok folyamatos bővülése határozta meg.
2025. 12. 17. 17:00
Megosztás:

Megérkeztek a téli szezonális élelmiszerlánc-ellenőrzés újabb eredményei

Élőhal-kereskedőket, forraltbor-árusokat, őstermelőket, vad- és halfeldogozókat, valamint nagyüzemi és kézműves söröket is ellenőriztek az elmúlt hetekben az élelmiszerlánc-biztonsági felügyelők. A Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih), valamint a kormány- és járási hivatalok szakemberi által végzett téli szezonális ellenőrzés újabb célterületeinek összesítése, egy-egy kirívó esettől eltekintve, pozitív tapasztalatokat hozott. Egy vadhúsfeldolgozó üzemben 3 tonna élelmiszert vontak ki a forgalomból és a működését is felfüggesztették. Egy sörben a dobozos termékeknél nem engedélyezett adalékanyagot mutatott ki a Nébih laboratóriuma - közölte az Agrárminisztérium (AM) szerdán az MTI-vel.
2025. 12. 17. 16:30
Megosztás:

Januártól Ukrajnában és Moldovában is a magyar tarifa szerint mobilozhatunk

2026. január 1-től Ukrajna és Moldova is tagja lesz az európai roamingzónának, így ha egy magyar előfizető ezen országokból telefonál haza vagy bármelyik uniós tagállamba, a hazai díjtételekkel számolhat.
2025. 12. 17. 16:00
Megosztás:

A Mol-csoport és a SOCAR szárazföldi kutatási és termelésmegosztási megállapodást írt alá

A Mol-csoport és a azerbajdzsáni állami olajtársaság, a SOCAR átfogó szénhidrogén kutatási, fejlesztési és termelésmegosztási megállapodást írt alá, amely Azerbajdzsán Shamakhi-Gobustan régiójának egy szárazföldi területére vonatkozik, a közös kutatási projektben a Mol-csoport operátorként 65 százalékos, a SOCAR pedig 35 százalékos részesedéssel rendelkezik - közölte a Mol szerdán az MTI-vel.
2025. 12. 17. 15:30
Megosztás:

Hamis szurkolói termékeket találtak a pénzügyőrök

Több ezer, ismert sportmárkák és külföldi klubcsapatok logójával ellátott terméket találtak pénzügyőrök egy vállalkozás székhelyén; a termékeket replikaként hirdette a cég - közölte a Nemzeti Adó- és Vámhivatal (NAV) szerdán az MTI-vel.
2025. 12. 17. 15:00
Megosztás:

A munkavállalók kevesebb, mint fele kapott bónuszt tavaly

Különösen aktívak a munkavállalók az álláspiacon, döntéseiket továbbra is a fizetések és juttatások mértéke határozza meg leginkább, így fokozott a vállalatokon lévő bérnyomás. Jelenleg minden harmadik dolgozó elgondolkozna a munkahelyváltáson, ha idén nem kapna prémiumot – derül ki a Profession.hu friss, reprezentatív kutatásából.
2025. 12. 17. 14:30
Megosztás:

Karácsonyi élményajándékozás pörgeti fel az utazási piacot

Az egyre népszerűbb karácsonyi élményajándékozás új lendületet ad az utazási kedvnek. A „télből a nyárba” programok mellett a jövő évi nyaralások és kulturális körutazások előfoglalása is megkezdődik, ahol a korai döntés nem csak kedvezményeket, de jobb helyeket is biztosít a népszerű desztinációk esetében.
2025. 12. 17. 14:00
Megosztás:

Újabb földterületek megvásárlására nyílik lehetőség

A földértékesítési program következő ütemében több mint ezer településen nyílik lehetőség 10 hektárnál kisebb területű, állami tulajdonú földrészlet megvásárlására. A földrészletekre 30 napig, azaz január 16-ig lehet vételi ajánlatot tenni az Agrárminisztérium (AM) Elektronikus Pályázati Rendszerének (EPR) felületén - közölte az AM szerdán az MTI-vel.
2025. 12. 17. 13:30
Megosztás:

2025-ben így tanulnak nyelveket a leggyorsabban fejlődők

A nyelvtanulás 2025-re végleg maga mögött hagyta a kizárólag tankönyv-alapú, frontális oktatást. A leggyorsabban fejlődő tanulók már pontosan tudják, hogy a siker nem a bemagolt nyelvtani szabályokon, hanem a tudatos módszerválasztáson és az aktív részvételen múlik. A hangsúly egyre inkább azon van, hogy a nyelv ne tantárgy legyen, hanem élő eszköz, amelyet a tanuló magabiztosan használ a mindennapokban, akár munkáról, utazásról vagy személyes kapcsolatokról van szó.
2025. 12. 17. 13:00
Megosztás:

Élvezd a stílusos lakberendezést: prémium bútorok nagy kedvezménnyel

Olasz bútormárkák közül válogathatsz rendkívüli árengedmény keretében, ahol kiemelkedő ajánlatokat találsz. Elegáns lakókörnyezetre vágysz, de eddig nem találtál rá az álmaid bútoraira a megfelelő áron?
2025. 12. 17. 12:30
Megosztás:

Óvodákat újítanak meg Csongrádon

Négy tagóvodát újítanak meg Csongrádon mintegy 300 millió forintból uniós támogatással - tájékoztatta az önkormányzat az MTI-t.
2025. 12. 17. 12:00
Megosztás:

Februártól 300.000 Ft készpénz vehető fel ingyenesen havonta

Kihirdették a vonatkozó jogszabályt, így most már biztos, hogy februártól az eddigi duplájára, havi 300 ezer forintra nő a bankkártyás készpénzfelvétel díjmentességének az értékhatára. A BiztosDöntés.hu szakértői szerint a változás nyomán a készpénzállomány is megugorhat a lakosságnál.
2025. 12. 17. 11:30
Megosztás:

Kötéltánc a bizonytalanság felett, új korszakban a Kockázatkezelési vezetők – megjelent a KPMG CRO-reportja

Az idei KPMG Summiton került publikálásra az ötödik KPMG CRO Report, amelyben a pénzügyi szektor kockázatkezelési vezetői számoltak be arról, hogyan látják és piaci trendeket és az aktuális kihívásokat. Idén a felmérésben közel 30 kockázatkezelési vezető (CRO) vett részt, három szektorból (bank, alapkezelő és biztosító), kérdőíves, illetve személyes interjú formájában. A november 27-én rendezett KPMG Summiton Szalai Péter, a vállalat kockázatkezelési tanácsadás területének vezetője és számos meghívott szakértő – többek között Barabási Albert-László fizikus és hálózatkutató; Szemerkényi Réka, Magyarország volt washingtoni nagykövete és Oszkó Péter, volt pénzügyminiszter – elemezték a kutatás eredményeit és a kockázatkezelés legnagyobb kihívásait.
2025. 12. 17. 11:00
Megosztás:

Adatvezérelt üzemmódba kapcsol az MNB

Ezúttal sem változott a kamatszint. A Magyar Nemzeti Bank a várakozásoknak megfelelően nem módosított a a kamatszinten, az alapkamatot 6,50 százalékon, az overnight jegybanki betét kamatát 5,50 százalékon, míg az overnight fedezett hitel kamatát 7,50 százalékon hagyták. Ezentúl ülésről ülésre dönt az MNB. A mai közleményben volt egy nagyon fontos változás, az utolsó mondat: "A Tanács folyamatosan értékeli a beérkező makrogazdasági adatokat és az inflációs kilátásokat befolyásoló tényezőket, kiemelten az év eleji átárazásokat, valamint a pénzügyi piacok stabilitását, amelyek alapján körültekintően és adatvezérelten, ülésről ülésre dönt az alapkamat mértékéről.”
2025. 12. 17. 10:30
Megosztás:

Eltűnt az árkülönbség az elektromos és hibrid autók között

Megjelent a Használtautó.hu és a Központi Statisztikai Hivatal novemberi közös statisztikája, amely szerint a hazai használtautó-piacon több kulcsterületen is lassuló, de egyre határozottabb szerkezeti átrendeződés figyelhető meg. Miközben az árkategóriák aránya hónapról hónapra stabilizálódik, az elektromos és hibrid hajtású modellek kínálata továbbra is jóval az átlag felett bővül, és a márkák, illetve modellek rangsorában is több figyelemre méltó elmozdulás történt.
2025. 12. 17. 10:00
Megosztás:

Űr- és védelmi fejlesztések: nemzetközi partnerséget kötött a 4iG

A 4iG Űr és Védelmi Technológiák Zrt. (4iG SDT), valamint a Northrop Grumman együttműködik a következő generációs védelmi rendszerek területén - közölte a 4iG kedden az MTI-vel.
2025. 12. 17. 09:30
Megosztás: