Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Amikor a konnektorban nincs áram – mit tehetsz ilyenkor?

Sokan tapasztalták már, hogy egy eszközt bedugnának a konnektorba, azonban semmi nem történik. Egy ilyen helyzet bosszantó lehet, főleg, amikor már indulnál a dolgodra, de az áram éppen akkor dönt úgy, hogy eltűnik.
2025. 10. 19. 00:01
Megosztás:

A legígéretesebb előértékesítés alatt álló kripto projektek, amelyeket nem hagyhatsz figyelmen kívül: Digitap ($TAP), BlockDAG, Tapzi és továbbiak – egyre forróbbak 2025-ben

A kriptopiac „legokosabb” tőkéje ma már nem a hype-ot, hanem a hasznosságot követi. 2025 következő nagy nyertesei nem mémcoinok vagy üres ígéretek lesznek, hanem azok a projektek, amelyek már most építenek, működnek, és valódi problémákat oldanak meg.
2025. 10. 18. 23:00
Megosztás:

Vészfék a DeFi-ben? Miért nem működik a Wall Street-i vészfék a blokkláncon?

Miközben a múlt pénteki kriptokrach során 19 milliárd dollárnyi pozíció likvidálódott percek alatt, sokan felvetették: lehetne-e valamilyen vészféket – úgynevezett circuit breakert – beépíteni a decentralizált pénzügyekbe is, hogy megelőzzük az ilyen zuhanásokat? A válasz: nem olyan egyszerű. Sőt, néhány szakértő szerint ez még ronthat is a helyzeten. Nézzük, miért!
2025. 10. 18. 22:00
Megosztás:

A szeretet rendet hagy maga után

A halálról beszélni nehéz. Sokak számára ez a téma valóságos tabu – olyan, mint ha már az elmúlás gondolata is balszerencsét hozna, és közelebb hozná az elkerülhetetlent.
2025. 10. 18. 21:00
Megosztás:

Szemkímélő beruházás az irodában – megéri a befektetés?

A mai modern, „fehérgalléros” munka szinte elképzelhetetlen monitor előtt töltött idő nélkül. A koncentráció, a kényelem és a tartós teljesítmény ezért nem csupán HR, hanem egyenesen pénzügyi kérdés is. Néhány apró ergonómiai fejlesztés – mint például egy minőségi monitor, megfelelő világítás vagy egy jó szemüveg – meglepően gyorsan megtérülhet, ráadásul csökkenhetnek a fejfájások és javulhat a munkavállaló teljesítménye.
2025. 10. 18. 20:00
Megosztás:

A Vatikán adatai szerint nőtt a katolikusok száma, csökkent a papoké

Egy év alatt több mint 15 millióval emelkedett, és meghaladja az 1,4 milliárdot a katolikusok száma a világban, miközben a papi hivatást választók száma csökkent - derült ki a Fides katolikus hírügynökség statisztikáiból, amelyeket pénteken mutattak be a Vatikánban.
2025. 10. 18. 19:00
Megosztás:

Szalmából készíthető szigetelőelemeket fejlesztett egy magyar vállalkozás

Innovációs támogatással, építőipari hasznosításra alkalmas, szalmából készíthető szigetelőelemeket fejlesztett az SSH-System Kft. – közölte a társaság az MTI-vel.
2025. 10. 18. 18:00
Megosztás:

Adathalász csalók próbálják megtéveszteni az MVM ügyfeleit

Az utóbbi időszakban az MVM Next ügyfelei egyre gyakrabban találkozhattak adathalász kísérletekkel, a társaság kéri ügyfeleit, hogy fokozott figyelemmel járjanak el minden gyanús megkeresés esetén.
2025. 10. 18. 17:00
Megosztás:

Az Ondo Finance blokkolná a Nasdaq tokenjavaslatát – Átláthatóságot követelnek a szabályozók előtt

Az Ondo Finance éles hangon szólította fel az amerikai tőzsdefelügyeletet (SEC), hogy halassza vagy utasítsa el a Nasdaq új tokenizált értékpapírokra vonatkozó javaslatát. A cég szerint az átláthatóság és a piaci egyenlőség veszélybe kerülhet, ha a jelenlegi formában elfogadják a tervet.
2025. 10. 18. 16:00
Megosztás:

Midnight Network: A Cardano-alapító új célpontja a blokkláncok adatvédelmi trónja

Charles Hoskinson, a Cardano megalkotója, új irányt szab a decentralizált adatvédelem világában: a cél, hogy 2026-ra a Midnight Network legyen a vezető privát okosszerződés-platform. Az ambiciózus terv már most hatással van a kriptoökoszisztémák működésére és fókuszaira.
2025. 10. 18. 15:29
Megosztás:

Robottechnológia segíti a daganatos betegek kezelését Debrecenben

Magyarországon elsőként a Debreceni Egyetem (DE) klinikai központjában vezették be az automatizált citosztatikus keverékinfúzió-összeállító robotot, az innovatív technológia alkalmazásával az eddiginél is biztonságosabb lehet a daganatos betegek gyógyszerellátása - jelezte az egyetem sajtóközpontja az MTI-nek.
2025. 10. 18. 13:00
Megosztás:

Leminősítette Franciaországot az S&P

Leminősítette Franciaországot az S&P Global Ratings, mindenekelőtt azzal a véleményével indokolva a döntést, hogy a költségvetési hiány további jelentős csökkentését célzó intézkedések hiánya miatt a következő években tovább romlanak a francia államadósságfolyamatok.
2025. 10. 18. 12:00
Megosztás:

A magyar nők 71 százaléka nem választaná a műszaki-informatikai pályát

A megkérdezett nők 71 százaléka nem tervezi, hogy műszaki, technológiai vagy informatikai pályán dolgozzon, míg a férfiaknál ez az arány 41 százalék - közölte az MTI-vel a CETIN Hungary friss országos kutatása alapján, amiből az is kiderült, hogy a mesterséges intelligenciával a magyarok nagy része még csak most ismerkedik.
2025. 10. 18. 11:10
Megosztás:

Példátlan biztonsági művelet készül Budapesten Trump és Putyin csúcsa előtt

Vadászgépek és zavaróberendezések biztosíthatják a budapesti találkozót: példátlan a biztonsági készültség Budapesten Donald Trump és Vlagyimir Putyin két héten belül esedékes találkozója miatt. A terrorelhárítás, a rendőrség, a honvédség és kiberbiztonsági szakemberek összehangolt munkája mellett az amerikai Secret Service és az orosz elnöki testőrség is részt vesz a műveletekben.
2025. 10. 18. 10:00
Megosztás:

3 csúcskategóriás altcoin, amely átlépheti az 1 dolláros szintet a negyedik negyedévben – A mindössze 0,0194 dolláros alulértékelt gyöngyszem lehet 2025 legnagyobb nyertese, állítják a szakértők

A közelmúltbeli árfolyammozgások csak még vonzóbbá tették a vezető altcoinokat, mint a DOGE és az ADA. Jelenleg az 1 dolláros szint alatt kereskednek, azonban várhatóan még az év vége előtt áttörik ezt a határt.
2025. 10. 18. 09:00
Megosztás:

Elindult a Fenntartható Turizmus Index kalkulátor

Elindult a turisztikai szolgáltatók és attrakciók számára ingyenesen elérhető Fenntartható Turizmus Index kalkulátor, a kezdeményezés célja a hazai turisztikai szolgáltatók támogatása a fenntartható működés irányába vezető úton, nemzetközi jó gyakorlatok alapján - közölte a programot kidolgozó Innotime Hungary Kft. az MTI-vel.
2025. 10. 18. 08:00
Megosztás:

Cardano árfolyam-előrejelzés: Visszatér az ADA az 0,50 dolláros szintre? Szakértők szerint ez a 2 altcoin akár tízszeres nyereséget is hozhat a negyedik negyedévben

A Cardano árfolyama ezen a héten 20%-kal esett vissza, így az 0,50 dolláros szint újbóli elérése nem zárható ki teljesen – a medvék jelenleg dominálnak. Ennek ellenére a szakértők két olyan altcoint is megneveztek, amelyek szerintük kötelező befektetések ebben a negyedévben.
2025. 10. 18. 07:35
Megosztás:

Lóga Máté a kettős adóztatás elkerüléséről szóló egyezmény visszaállításáról tárgyalt amerikai kollégájával Washingtonban

A tegnapi napon Kenneth Kies, az Amerikai Egyesült Államok Pénzügyminisztériumának (US Department of the Treasury) adópolitikáért felelős államtitkára hivatalában fogadta Lóga Mátét, a Nemzetgazdasági Minisztérium gazdaságfejlesztésért és iparért felelős államtitkárát.
2025. 10. 18. 07:00
Megosztás:

Az MVM télindító klímaakciót indít a háztartások támogatására

Az MVM csoport kedvezményes klímával segíti a téli felkészülést lakossági ügyfeleinek, ezzel a korszerű, hűtő-fűtő klímaberendezések elérhetőségét kívánja megkönnyíteni a háztartások számára - közölte az MVM csoport az MTI-vel pénteken.
2025. 10. 18. 06:00
Megosztás:

Átadták az ország egyik legnagyobb áramhálózati alállomását Nyíregyháza határában

Átadták az ország egyik legnagyobb áramhálózati alállomását Nyíregyháza-Nyírjesen pénteken, a több mint 18,2 milliárd forint értékű beruházás elsősorban a helyi ipari parkba betelepülő vállalatoknak biztosítja a villamosenergia-ellátást.
2025. 10. 18. 05:00
Megosztás: