Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Hol lesz a Bitcoin 5 év múlva?

A Bitcoin (CRYPTO: BTC) a nyár folyamán új történelmi csúcsot ért el, 124 457 dolláron, és ezzel együtt a vezető elemzők és iparági szereplők is frissíteni kezdték hosszú távú előrejelzéseiket.
2025. 09. 14. 12:00
Megosztás:

Tokenizált államkötvény jelentése és szerepe a modern pénzügyekben

A digitális forradalom elérte az államkötvényeket is: megjelentek a tokenizált államkötvények. De mit is jelent ez pontosan? Hogyan működik? És miért lehet ez fontos a kriptovaluta-piac jövője szempontjából? Ebben az átfogó, közérthető elemző cikkben mindent elmagyarázunk a tokenizált államkötvényekről – példákkal, analógiákkal és gyakorlati betekintéssel, még azok számára is, akik sosem hallottak még sem a kötvényről, sem a tokenről.
2025. 09. 14. 11:00
Megosztás:

Hová meneküljünk, ha zuhan a kriptó? – A biztonságos kripto-befektetések toplistája medvepiacon

A kriptovaluta piac viharai idején sok befektető pánikszerűen keres menedéket: de vajon mely eszközök számítanak igazán biztonságosnak? A cikkben utánajárunk, hogyan érdemes átrendezni portfóliónkat, ha elindul a lejtmenet – legyen szó stabilcoinokról, aranyról, vagy akár passzív jövedelemtermelő stratégiákról.
2025. 09. 14. 10:00
Megosztás:

Extra védelmet kaphatnak a gyerekek is

A sulikezdés miatt is érdemes megnézni a lakásbiztosítást. Az új tanév kezdetével nemcsak a tanszereket érdemes beszerezni, hanem a család biztonságáról is gondoskodni.
2025. 09. 14. 09:00
Megosztás:

Négy aranyérmet nyertek a magyarok Európa legnagyobb szakmai versenyén

Négy aranyérmet nyertek a magyarok Európa legnagyobb szakmai versenyén, a EuroSkills Herning 2025 bajnokságon - tájékoztatta a Magyar Kereskedelmi és Iparkamara (MKIK) szombat este közleményben az MTI-t.
2025. 09. 14. 07:00
Megosztás:

Felavatták a Nemzeti Űrközpontot Moszkvában

Hivatalosan megnyitotta az új orosz Nemzeti Űrközpontot (NKC) Vlagyimir Putyin elnök szombaton Moszkva nyugati részén, a Mihail Hrunyicsev mérnök altábornagy nevét viselő Állami Űrkutatási és Gyártási Központ (GKNPC) területén.
2025. 09. 14. 05:00
Megosztás:

A fővárosi önkormányzat idén is megrendezi a Budapest Állásbörzét

A fővárosi önkormányzat idén is megrendezi a Budapest Állásbörzét, ahol az érdeklődők megismerhetik a fővárosi fenntartású és üzemeltetésű cégek, intézmények tevékenységét és személyesen találkozhatnak a toborzási feladatokat ellátó kollégákkal - közölte a Főpolgármesteri Hivatal pénteken az MTI-vel.
2025. 09. 14. 04:00
Megosztás:

Ukrán elnök: Ukrajna kész segíteni lengyel katonák kiképzésében

Ukrajna kész megosztani tapasztalatait Varsóval, segíteni a lengyel katonák kiképzésében, valamint közös védelmi rendszert kiépíteni Lengyelországgal - jelentette ki közösségi oldalain Volodimir Zelenszkij ukrán elnök pénteken, miután Kijevben fogadta Radoslaw Sikorski lengyel külügyminisztert.
2025. 09. 14. 03:00
Megosztás:

Átverések - Önkiszolgáló kasszák a LIDL-ben TESCO-ban, ALDI-ban

Az önkiszolgáló kasszák bevezetésével a vásárlás folyamata egyszerűbbé és kényelmesebbé vált mind a fogyasztók, mind az üzletek szempontjából. Ugyanakkor ez a megoldás nem csupán előnyöket kínál, hanem új teret is nyitott azok számára, akik visszaélésekre törekednek. Mutatjuk hogyan!
2025. 09. 14. 02:00
Megosztás:

Politikai döntés: kötelező jogosítványcsere Magyarországon

2033-ig az Európai Unió minden tagállamában be kell vezetni az új formátumú vezetői engedélyeket. Kinek, mikorra kell lecserélni a jogsiját, hogyan érinti ez a magyar lakosságot?
2025. 09. 14. 01:01
Megosztás:

Mennyi áramot fogyaszt a hűtőszekrény? Mennyibe kerül havonta?

Hűtőszekrény fogyasztása havi szinten, forintban. Hány forintba kerül havi szinten egy folyamatosan működő hűtőszekrény egy háztartásnak? Villamos energia fogyasztás kalkuláció.
2025. 09. 14. 00:03
Megosztás:

Solana árfolyam előrejelzés, fontos XRP ETF fejlemény, és a legjobb mémcoin 2025-re 100-szoros hozampotenciállal

A kriptopiac pezseg, ahogy a befektetők figyelik a legfrissebb Solana árfolyam-előrejelzéseket, valamint az XRP ETF körüli új fejleményeket. A SOL komoly emelkedést mutat a hálózati frissítése után, miközben az intézményi figyelem egyre inkább az XRP felé irányul az ETF-várakozások miatt. A kereskedők most azt mérlegelik, hol lehet a következő 100-szoros lehetőség.
2025. 09. 13. 23:00
Megosztás:

Duna House: Budapesten nőtt az első lakást vásárlók aránya

Augusztusban az ingatlanpiacot az Otthon Start Program hatásai határozták meg, mely a lakáspiacon évek óta nem tapasztalt élénkülést eredményezett - derült ki a Duna House pénteken kiadott legfrissebb ingatlanpiaci elemzéséből. A barométer adatai szerint a fiatal vásárlók előretörése különösen Budapesten szembetűnő: egy év alatt 23 százalékról 36 százalékra ugrott az első lakást vásárlók aránya, a trend összhangban van a program céljaival, amelyek az otthonteremtést ösztönzik.
2025. 09. 13. 22:00
Megosztás:

FLOKI, PEPE, BONK, SHIB és LBRETT: Szakértők szerint ez az egy mémcoin érheti el a 100-szoros nyereséget ebben a ciklusban

Nem minden mémcoin egyforma. Néhány pillanatok alatt berobban, majd eltűnik. Mások átvészelik a medvepiacot, és akkor emelkednek, amikor senki sem figyel. És van az a ritka néhány, amelyben a narratíva, az időzítés és a lendület éppen megfelelő elegyben van jelen ahhoz, hogy valóra váltsa a kriptos álmokat.
2025. 09. 13. 21:00
Megosztás:

Rétvári Bence: új funkcióval bővült az EgészségAblak applikáció

A vastagbélszűrésre szóló meghívó is megjelenik mostantól az EgészségAblak applikációban - mondta a Belügyminisztérium parlamenti államtitkára péF
2025. 09. 13. 20:00
Megosztás:

Bitcoin árfolyam-előrejelzés szeptember végére, friss hírek az XRP-ről, és a szakértők szerint ez az altcoin lehet a következő 100-szorozó befutó

A kriptopiac idén szeptemberben tele van kérdésekkel. Az elemzők megosztottak a legújabb Bitcoin árfolyam-előrejelzéseket illetően, az XRP-vel kapcsolatos hírek pedig folyamatosan érkeznek — ennek ellenére egyik érme sem tűnik kitörésre késznek.
2025. 09. 13. 19:00
Megosztás:

A pénzügyi és adóügyi együttműködés elmélyítéséről egyeztetett Magyarország és Vietnám

Gerlaki Bence adóügyekért, kereskedelemért és fogyasztóvédelemért felelős államtitkár, valamint Besesek Botond adószabályozásért és számvitelért felelős helyettes államtitkár hivatalában fogadta Cao Anh Tuấn vietnámi pénzügyminiszter-helyettest és delegációját. A tárgyalás során a felek áttekintették a két ország gazdasági és pénzügyi együttműködésének legfontosabb kérdéseit, kiemelt figyelmet fordítva a gazdaság fehérítése érdekében tett közös lépésekre, a digitalizációra, az adóügyi adminisztráció korszerűsítésére, valamint a vállalkozások adóztatásának tapasztalataira.
2025. 09. 13. 18:00
Megosztás:

Az amerikai vámok és az európai zöldpolitika szorításában is stabilak a hazai gumiabroncspiac kilátásai

Az amerikai vámpolitika és az európai zöldátállás bizonytalanságai ellenére a hazai gumiabroncsipar kilátásai stabilak, az autóipar jövője pedig egyértelműen az elektromos közlekedés felé tart – hangzott el az idei Continental Gumiabroncs Konferencián. Az idén hetedik alkalommal megrendezett szakmai fórumon a Continental Hungaria Kft. partnerei és a gumiabroncs-ipar szakértői vitatták meg az ágazat jövőjét és legfontosabb trendjeit. Az innovációk sorából kiemelt figyelmet kapott a Conti GreenConcept: a Continental tervei szerint 5-7 éven belül 100%-ban újrahasznosított abroncsok kerülhetnek sorozatgyártásba.
2025. 09. 13. 16:00
Megosztás:

Ukrán elnök: a NATO képes reagálni orosz dróntámadásra anélkül, hogy belesodródjon a háborúba

A NATO-nak van lehetősége hatékonyan reagálni orosz dróntámadásra anélkül, hogy az a szövetségnek a háborúba való közvetlen bekapcsolódását jelentené - vélekedett Volodimir Zelenszkij ukrán elnök pénteken Kijevben az évente megrendezett Jaltai Európai Stratégia (YES) konferencián, utalva a két nappal korábbi lengyelországi drónincidensre.
2025. 09. 13. 15:00
Megosztás:

Szeptember végéig igényelhető vissza a külföldön megfizetett áfa

Közeledik a külföldiáfa-visszatérítési kérelmek beadásának határideje – figyelmeztet a Forvis Mazars. A nemzetközi könyvvizsgáló és tanácsadó vállalat emlékeztet arra, hogy a 2024-ben kiállított számlák alapján legkésőbb 2025. szeptember 30-ig élhetnek a belföldi adóalanyok a visszatérítés lehetőségével, ha más uniós tagállamokban vagy bizonyos harmadik országokban fizettek áfát.
2025. 09. 13. 14:00
Megosztás: