Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

MicroStrategy újabb közel 1 milliárd dollárért vásárolt Bitcoint – egyre több a kérdőjel a finanszírozás körül

A MicroStrategy bejelentette, hogy további 10 624 darab Bitcoint vásárolt, mintegy 1 milliárd dollár értékben, így a vállalat teljes BTC-állománya már elérte a 660 624 darabot.
2025. 12. 09. 02:00
Megosztás:

Kilenc új célállomásra indít járatot Marosvásárhelyről a Wizz Air

Újranyitja marosvásárhelyi bázisát és márciustól kilenc új célállomásra indít járatot a Wizz Air - jelentette be a légitársaság a marosvásárhelyi Transilvania nemzetközi repülőtéren hétfőn tartott sajtótájékoztatón.
2025. 12. 09. 01:30
Megosztás:

Két évtizedes tőzsdei sztorit ünnepelt az ANY Biztonsági Nyomda Nyrt.

Az Állami Nyomda 2005 decemberében vezette be részvényeit a Budapesti Értéktőzsdére, azóta a Prémium kategóriában az egyetlen nyomdaipari cégként van jelen. Az elmúlt két évtizedben az ANY Nyrt. stabil pénzügyi teljesítménnyel, következetes növekedéssel és folyamatos innovációval erősítette pozícióját a régióban. Minderről egy ünnepi kereskedésindító csengetési ceremónia keretében emlékezett meg a tőzsdével közösen.
2025. 12. 09. 01:00
Megosztás:

Az évszázad legnagyobb könyvadományával gazdagodott a Magyar Tudományos Akadémia

Az évszázad legnagyobb könyvadományával gazdagodott a Magyar Tudományos Akadémia (MTA): Rozsondai Marianne és Rozsondai Béla 64 kötetből álló, 15. századi ősnyomtatványokat és 16. század eleji nyomtatott könyveket tartalmazó egyedülálló magángyűjteményüket ajándékozták az Akadémia könyvtárának, köztük 18 olyan példányt, amely egyetlenként ismert egész Magyarországon - hangzott el hétfőn Budapesten, a felajánlás alkalmából rendezett ünnepségen.
2025. 12. 09. 00:05
Megosztás:

Sztrájkot hirdettek a párizsi Louvre dolgozói december 15-től

Határozatlan idejű sztrájkot hirdettek december 15-től a párizsi Louvre dolgozói, tiltakozásul a "romló munkakörülményeik" és az "elégtelen források" miatt - közölte a világ leglátogatottabb múzeumának CFDT szakszervezete hétfőn a többi érdekképviselettel történt egyeztetést követően.
2025. 12. 08. 23:30
Megosztás:

Az új Mercedes‑Benz GLB: ikonikus dizájn, csúcstechnológia, mindennapi sokoldalúság

Bemutatták az új, tisztán elektromos Mercedes‑Benz GLB-t. A márka legfrissebb kompakt SUV‑modelljének sorozatgyártása 2025 decemberében kezdődik meg a Mercedes-Benz kecskeméti gyárában. Az új modell egyszerre testesíti meg a prémium dizájnt, a nagyvonalú helykínálatot és a legmodernebb technológiát. Az új GLB öt- és hétüléses változata tágas csomagteret, kiemelkedő hatótávot és innovatív megoldásokat kínál.
2025. 12. 08. 23:00
Megosztás:

Brit-ukrán-német-francia csúcstalálkozót tartottak Londonban

Csúcstalálkozót tartottak hétfőn a londoni miniszterelnöki hivatalban Nagy-Britannia, Ukrajna, Németország és Franciaország vezetői.
2025. 12. 08. 22:30
Megosztás:

4 token, amit érdemes figyelni, ha kriptobarát Fed-elnök kerül hatalomra – a Digitap ($TAP) vezeti a legjobb előértékesítési listákat

Egy kriptobarát Federal Reserve elnök javíthatná a digitális eszközök és a hagyományos pénzügyek közötti együttműködést, új lehetőségeket teremtve az innovatív projektek számára. Olyan platformok, mint a DeepSnitch AI és a Bitcoin Hyper, az automatizált kereskedés és Layer 2 megoldások területén feszegetik a határokat, míg a LivLive a való világ élményeit gamifikálja.
2025. 12. 08. 22:00
Megosztás:

Törökország vezető vállalataival kötött stratégiai megállapodást a 4iG

Orbán Viktor, Magyarország miniszterelnöke és Recep Tayyip Erdoğan, Törökország elnökének jelenlétében, a két ország kiemelt diplomáciai és gazdasági együttműködési fórumán, a Felső szintű Stratégiai Együttműködési Tanács ülésén átfogó védelmi ipari keretmegállapodást kötött a török Védelmi Ipari Elnökség (SSB) és a magyar Nemzetgazdasági Minisztérium (NGM).
2025. 12. 08. 21:30
Megosztás:

Maradna a kétéves vizsgáztatási ciklus a tíz évnél idősebb autóknál is

Maradna a kétéves vizsgáztatási ciklus a tíz évnél idősebb autóknál is - közölte az Építési és Közlekedési Minisztérium (ÉKM) hétfőn az MTI-vel.
2025. 12. 08. 21:00
Megosztás:

Gyengült a forint hétfő estére

Gyengült a forint a főbb devizákkal szemben hétfőn kora estére a bankközi devizapiacon reggelhez képest.
2025. 12. 08. 20:30
Megosztás:

90 000 dolláros Bitcoin vagy alacsony piaci értékű Digitap ($TAP): Melyik a legjobb kriptovaluta 2026-ra?

A Bitcoin jelenleg azzal küzd, hogy áttörje a 90 000 dolláros szintet, és az, hogy nem tud tartósan ezen a zónán felül maradni, sok elemzőt aggodalommal tölt el. Egyesek szerint, ha nem sikerül visszafoglalni ezt a szintet, az mélyebb árzuhanásokhoz és elhúzódó likvidálásokhoz vezethet a piacon.
2025. 12. 08. 20:00
Megosztás:

Miért érdemes 2026-ban abbahagyni a „stakinget” és a „kereskedést”: Az Eden Miner okosabb alternatívát kínál

A kriptoeszközeid még mindig a tőzsdék szívszorító volatilitását szenvedik el? Vagy DeFi protokollokba vannak zárva, ahol csupán szerény éves hozamokat (APY) termelnek?
2025. 12. 08. 19:36
Megosztás:

A mesterséges intelligencia a pénzügyi rendszer új motorja lehet

A mesterséges intelligencia (MI) a pénzügyi rendszer új motorja lehet - hangsúlyozta Izer Norbert, a jegybank pénzpiacokért és digitalizációért felelős ügyvezető igazgatója a Magyar Nemzeti Bank (MNB) podcast műsorában.
2025. 12. 08. 19:00
Megosztás:

Mol: magyar-török szénhidrogén-kutatás kezdődött a Dunántúlon

Buzsák környékén megkezdte a szeizmikus méréseket a Mol-csoport és Törökország nemzeti kutatás-termelési cége, a Turkish Petroleum Corporation (TPAO). Azt vizsgálják, hogy a dél-dunántúli koncessziós területek alatt található-e ígéretes kőolaj- vagy földgázlelőhely - közölte a Mol-csoport hétfőn az MTI-vel.
2025. 12. 08. 18:30
Megosztás:

Lezárult a Nébih országos téli élelmiszerlánc-ellenőrzésének első szakasza

Lezárult a november 3-án indult téli élelmiszerlánc ellenőrzés-sorozat első szakasza, összességében biztató eredményekkel - tájékoztatta az Agrárminisztérium (AM) hétfőn az MTI-t.
2025. 12. 08. 18:00
Megosztás:

Az OTP Csoport harmadszor is a kelet-közép európai régió élén a The Banker TOP100-as bankok rangsorában

A The Banker, a Financial Times csoport meghatározó szaklapja több mint száz éve a globális pénzügyi szektor egyik legelismertebb forrása.
2025. 12. 08. 17:30
Megosztás:

Előre csúszott a karácsonyi bevásárlás? Kiugró fogalmat hozott a Black November a MediaMarktnál

Dinamikus növekedést hozott az idei Black November a MediaMarktnál. A friss adatok alapján a magyar vásárlók egyre tudatosabban időzítenek erre az időszakra, így az idén a piac általános trendjével ellentétben kiugró számban fogytak a televíziók és jelentősen nőtt az átlagos kosárérték. A kampányidőszak másik nagy nyertesei a biztonságot nyújtó kiegészítő szolgáltatások és a mobiltelefon-kiegészítők voltak.
2025. 12. 08. 17:00
Megosztás:

Év végéig lehet jelentkezni az MCC művészeti tehetségkutatójára

A Mathias Corvinus Collegium (MCC) Középiskolás Programja harmadik alkalommal szervezi meg a teljes Kárpát-medencére kiterjedő művészeti tehetségkutató programsorozatát, az MCC ARS-ot, amelyre év végéig lehet jelentkezni.
2025. 12. 08. 16:05
Megosztás:

Prágában már valóság, Budapest következik? - robotkiszállítást tesztelt a foodora

A foodora új korszakot kezd meg Csehországban: elindítja a meleg ételek és élelmiszerek robotos kiszállítását Prágában. A tesztprojekt a cseh főváros 8. kerületében zajlik, ahol három robot szállít McDonald's rendeléseket körülbelül 2 km-es körzetben. Ez a kezdeményezés közvetlenül épít a svéd sikermodellre, ahol márciusban indították el a cég első európai robotkiszállítási programját.
2025. 12. 08. 15:00
Megosztás: