Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Szijjártó Péter: az amerikai vámemelés is a brüsszeli vezetés alkalmatlanságát bizonyítja

Az Európai Unióval szemben frissen bejelentett amerikai vámemelések is a brüsszeli vezetés alkalmatlanságát bizonyítják, ezért itt lenne az ideje egy patrióta fordulatnak - írta Szijjártó Péter külgazdasági és külügyminiszter szombaton a Facebookon.
2025. 07. 13. 04:00
Megosztás:

Idősebb korosztályok nyomulnak a hitelpiacon – ők vállalják a nagyobb kockázatot

Bár a 10 százalékos önerő lehetősége miatt sokan a fiataloktól várták a bátrabb hitelfelvételt, a valóság ennek épp az ellenkezője: sokkal inkább az 50 év feletti korosztály veszi fel az ingatlan értékének mind nagyobb részét hitelként – hívja fel a figyelmet Gergely Péter, a BiztosDöntés.hu pénzügyi szakértője.
2025. 07. 13. 03:00
Megosztás:

Megbüntetnek! Így változik a kerítés építés szabálya!

A kerítés műszaki építménynek számít, de általában nem engedélyköteles, tehát nem szükséges hozzá építési engedély ám ez nem jelenti azt, hogy bármit szabad építeni.
2025. 07. 13. 02:00
Megosztás:

Elfogadták! Így változott a 65 év felettiek kedvezményes utazása

A közforgalmú személyszállítás során a 65. életévüket betöltött személyek életkoruk alapján díjmentesen utazhatnak, pusztán személyazonosító okmányuk felmutatásával. Számukra már nincs szükség utazási utalványra az ingyenes utazáshoz. Azok a személyek viszont, akik még nem múltak el 65 évesek, de nyugdíjban vagy egyéb meghatározott ellátásban részesülnek, éves utalvány alapján vehetik igénybe az utazási kedvezményeket.
2025. 07. 13. 01:00
Megosztás:

Hyperliquid áttörése: 10,6 milliárd dolláros nyitott pozícióval új DeFi rekord született

A decentralizált pénzügyek világa új korszakba lépett. A Hyperliquid nevű derivatíva-kereskedési platform lenyűgöző teljesítményt nyújtott: nyitott pozícióinak (open interest) összértéke meghaladta a 10,6 milliárd dollárt, ezzel új csúcsot állítva fel a DEX-ek (decentralizált tőzsdék) történetében. De mitől lett ilyen népszerű ez az eddig kevéssé ismert szereplő? És mit árul el mindez a kriptopiac fejlődési irányáról?
2025. 07. 12. 23:00
Megosztás:

Ethereum újra lendületben: Négy nap alatt 5,46 milliárd dolláros láncon belüli forgalom!

Miközben a kriptopiac ingadozó hangulatban van, az Ethereum (ETH) látványos aktivitással hívta fel magára a figyelmet: alig négy nap alatt 5,46 milliárd dollárnyi tranzakció zajlott le a blokkláncán. Vajon mit jelez ez a masszív növekedés? Csak átmeneti fellángolásról van szó, vagy valóban újabb felfutás küszöbén állunk?
2025. 07. 12. 22:00
Megosztás:

Íme 50 bolt, ahol már most fizethetsz kriptovalutával

A kriptovaluták már rég túlléptek a spekuláció határán – egyre több helyen válhatnak valódi fizetőeszközzé. Ha Bitcoinod vagy más digitális valutád van, már most is akad bőven olyan üzlet, ahol szívesen fogadják el a virtuális pénzed. Nézd meg, hol vásárolhatsz közvetlenül vagy közvetve kriptóval – és miért lehet ez forradalmi lépés a globális pénzügyi rendszerben.
2025. 07. 12. 21:00
Megosztás:

A megfelelő folyadékellátás biztosítása úton lévő járművek számára

Eszünkbe jut-e vajon, hogy a hosszú utak során a járművezetők megfelelő folyadékellátása mennyire kulcsfontosságú? Az utazások során a megfelelő ivóvízellátás nem csupán kényelmi kérdés, hanem alapvető szükséglet is. Bár sokan talán nem gondolnák, a kamionok és más haszongépjárművek egyik leglényegesebb felszerelése a vizeskanna és a víztartály, amelyek lehetővé teszik, hogy a sofőrök mindig hozzáférjenek friss vízhez, bárhol is járjanak.
2025. 07. 12. 20:00
Megosztás:

A Bitcoin már nagyobb, mint a Google és az ezüst – Az Amazon a következő célpont?

A Bitcoin újabb történelmi mérföldkőhöz érkezett: piaci kapitalizációja immár meghaladja az Alphabet (Google) és az ezüst értékét is. Miközben sokan még mindig kétkedve tekintenek a kriptovalutákra, a legnagyobb digitális eszköz feltartóztathatatlanul tör előre – a következő kihívott pedig nem más, mint az Amazon.
2025. 07. 12. 19:00
Megosztás:

Kitört az XRP árfolyama? Indul az „XRP-szezon” – Erődemonstráció a Bitcoinnal szemben

Az XRP hetek óta a háttérben gyűjtötte az erőt, most viszont végre áttörte azt az ellenállási szintet, amely korábban rendre visszafogta a mozgását a Bitcoinhoz képest. Alex Cobb elemző szerint „elég volt, most indul az XRP-szezon”. Vajon tényleg új altcoin-ciklus elé nézünk? Elemzünk, értékelünk, és megmutatjuk, mit érdemes figyelni.
2025. 07. 12. 18:00
Megosztás:

A Binance áttöri a falakat: Halal kriptostaking a muszlim világ számára

A kriptovaluták világa új korszakba lépett: a Binance elindította a világ első, hivatalosan is saría-kompatibilis staking szolgáltatását. A Sharia Earn névre keresztelt kezdeményezés célja, hogy elérhetővé tegye a passzív kriptojövedelmet azok számára is, akik eddig vallási okokból tartózkodtak az ilyen típusú pénzügyi termékektől. Ez az újítás akár több mint 1,9 milliárd ember pénzügyi életét formálhatja át világszerte.
2025. 07. 12. 17:00
Megosztás:

Így hoz megtérülést a jól tervezett reklám

A vizuális jelenlét ma már minden vállalkozás számára nélkülözhetetlen. Egy jól megtervezett, látványos molinó pedig bármelyik cég számára hatalmas versenyelőnyt jelenthet. Így ha jól tervezzük meg reklámeszközünk gyártásának lépéseit, akkor egy kiváló, hosszú távú befektetést jelentő eszköz lehet arra, hogy hosszú távon is erősítse a márkajelenlétet, valamint hogy a vállalkozás kommunikációjának látványos eleme legyen.
2025. 07. 12. 16:00
Megosztás:

Kapszulagardrób férfiaknak – tippek a megvalósításhoz

A férfiak számára a ruhavásárlás sokszor csak nyűg, és nem kifejezetten veszik rá magukat szívesen. Éppen ezért ebben a cikkünkben most nekik hoztunk egy szuper tippet arra, hogyan lehet kevés ruhadarabbal is boldogulni úgy, hogy közben mindig stílusosak maradunk.
2025. 07. 12. 14:00
Megosztás:

Hankó Balázs: megújult és sikeres a magyar felsőoktatás

Megújult és sikeres a magyar felsőoktatás, hazánk 12 egyeteme a világ legjobb öt százalékában van és 19 ezerrel több diák jár műszaki, agrár, mérnöki és orvostudományi képzésekre - mondta a Kulturális és Innovációs Minisztérium (KIM) vezetője pénteken, Gödöllőn.
2025. 07. 12. 13:00
Megosztás:

A Trump-kormányzat szolgáltatások és juttatások széles körét vonta meg

A Trump-kormányzat szolgáltatások és juttatások széles körét vonta meg az illegálisan az Egyesült Államokban tartózkodóktól, mintegy 40 milliárd dollár értékben – közölte a washingtoni Fehér Ház.
2025. 07. 12. 12:00
Megosztás:

Magyarországnak 2036-ban lehet nagy esélye olimpiát rendezni

Gyulay Zsolt, a Magyar Olimpiai Bizottság (MOB) elnöke szerint Magyarországnak 2036-ban lehet a legnagyobb esélye a nyári játékok megrendezésére, azt követően viszont már nagyobb lesz az európai konkurencia.
2025. 07. 12. 11:00
Megosztás:

Otthon Start: Mélypont után fordulat jöhet a támogatott lakáshitelek piacán

Tavaly tavasz óta tartó csökkenés után fordulatot hozhat a támogatott lakáshitelek piacán az Otthon Start Program. Ennek oka, hogy kevesebb feltételt kell hozzá teljesíteni, és az alacsonyabb kamatszintből adódóan 25-33 százalékkal nőhet a felvehető hitelösszeg, jobban igazodva a megemelkedett ingatlanárakhoz, így szélesebb rétegek számára válhat elérhetővé az első lakás megszerzése – derül ki a Független Pénzügyi Közvetítők Országos Szövetségének (FPKOSZ) elemzéséből.
2025. 07. 12. 10:00
Megosztás:

Németországban emelkedtek a nagykereskedelmi árak

Németországban júniusban gyorsult a nagykereskedelmi árak éves növekedése, havi összevetésben maradt a májusi ütem a német szövetségi statisztikai hivatal, a Destatis pénteken ismertetett adatai szerint.
2025. 07. 12. 09:00
Megosztás:

Vegyszerbotrány? – A szúnyoggyérítők szerint alaptalanok a félelmek

Nem igaz, hogy magzatkárosító a kémiai szúnyoggyérítés során Magyarországon használt vegyszer - közölték sajtóhírekre reagálva a katasztrófavédelem által megbízott szúnyoggyérítő konzorcium vezetői pénteken az MTI-vel.
2025. 07. 12. 08:00
Megosztás:

Nyugdíjasok figyelem! Az élelmiszer utalvánnyal a postás csak egyszer csengethet

Újabb bomba a nyugdíjasoknak: csak egyszer viszi ki a postás a címre a kormány adományát, a 30 ezer forintos élelmiszer utalványt, s aki nincs otthon a kézbesítéskor, az bottal ütheti a nyomát.
2025. 07. 12. 06:46
Megosztás: