Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Kétmillió ember fantáziáját mozgatta meg a lakáspiac 2025-ben

A magyar lakáspiac 2025-ben rendhagyó és kiemelkedően aktív időszakot zárt, mivel egyetlen naptári éven belül két markáns keresleti hullám alakult ki, erre pedig a modern hazai lakáspiac történetében eddig nem volt példa. Az első hullám az év elején érkezett, amikor sokan a magas hozamú állampapírokból felszabaduló megtakarításainak kerestek ingatlanpiaci befektetési lehetőséget. A második, még jelentősebb roham nyár végétől indult, miután bejelentették az Otthon Start Programot (OSP), amely kifejezetten az elsőlakás-vásárlók számára kínál kedvező feltételeket.
2025. 12. 14. 21:00
Megosztás:

Ezekkel a számokkal nyerhettél a hatos lottón!

A Szerencsejáték Zrt. tájékoztatása szerint az 50. héten megtartott hatos lottó számsorsoláson a következő számokat húzták ki:
2025. 12. 14. 20:00
Megosztás:

Bitfarms: már nem csak Bitcoin-bányász, hanem AI-energiaplay

A Bitfarms részvényei 2025-ben látványosan felülteljesítették a Bitcoint: miközben a BTC az év eleje óta mínuszban van, a BITF árfolyama közel 90%-kal emelkedett. Ennek oka nem a kriptopiac ereje, hanem éppen az, hogy a vállalat tudatosan eltávolodik a klasszikus Bitcoin-bányászattól, és egyre inkább energia- és digitális infrastruktúra-szolgáltatóvá alakul át, kifejezetten az AI-adatközpontok igényeire szabva.
2025. 12. 14. 19:00
Megosztás:

Melyik faj lesz az év hala 2026-ban?

A Magyar Haltani Társaság ismét nyilvános szavazást hirdetett az Év hala cím elnyerésére. A közönség 2026-ra három őshonos halfaj közül választhat, a kezdeményezés célja a hazai halfauna megismertetése és népszerűsítése. Szavazni december 31-ig lehet a társaság honlapján, ahol a leadott voksok aktuális állása is folyamatosan nyomon követhető.
2025. 12. 14. 18:00
Megosztás:

Az Egyesült Államok feloldotta a Fehéroroszország elleni szankciókat a kálium-karbonát esetében

Az Egyesült Államok feloldotta a Fehéroroszország elleni szankciókat a műtrágya alapanyagaként használt kálium-karbonát esetében - jelentette be az amerikai adminisztráció szombaton, amelyet követően visszanyerte szabadságát több mint 100 bebörtönzött ellenzéki.
2025. 12. 14. 17:00
Megosztás:

Sokan nem ismerik a jövő évi újdonságokat az autópályák használatában

Jövőre több újdonság is lesz az autópályák használatában, és ezeket sokan nem ismerik - közölte az autopalyamatrica.hu online felmérése alapján vasárnap az MTI-vel.
2025. 12. 14. 17:00
Megosztás:

Félidejéhez érkezett az Ökumenikus Segélyszervezet adventi adománygyűjtése

Félidejéhez érkezett az Ökumenikus Segélyszervezet 30. adventi adománygyűjtése, amelyhez már több százezren csatlakoztak, több mint 100 millió forintot ajánlottak fel a nélkülözők támogatására – közölte a segélyszervezet vasárnap az MTI-vel.
2025. 12. 14. 16:00
Megosztás:

Az Air China tavasztól naponta indít járatot Budapest és Peking között

Az Air China légitársaság a jelenlegi heti négy helyett tavasztól naponta indít járatot Budapest és Peking között, ezzel a magyar főváros lesz a negyedik az Európai Unióban, amely napi közvetlen légi összeköttetéssel fog állni a kínaival - közölte Szijjártó Péter külgazdasági és külügyminiszter vasárnap Budapesten.
2025. 12. 14. 15:00
Megosztás:

Kína új jogi irányelvei felforgathatják a kriptobűnözés kezelését – Jöhet a globális szabályozási hullám?

Kína új jogi javaslatot terjesztett elő, amely alapjaiban reformálhatja a kriptovalutákkal kapcsolatos bűncselekmények kezelését. A cél: átláthatóbb bírósági eljárások, szabályozott eszközértékesítések és a károsultak hatékonyabb védelme. Bár a nemzetközi piac egyelőre higgadtan reagált, a lépés globális hatással is járhat. Lássuk, mit tartalmaz a kínai igazságügyi hálózat friss javaslata, és miért érdemes figyelni rá a kriptopiaci szereplőknek!
2025. 12. 14. 14:00
Megosztás:

Bitcoin árfolyam előrejelzés 2030-ig: 500 ezer vagy 1 millió dollár? A BTC jövője intézményi szemmel

A Bitcoin ismét fordulóponthoz érkezett: az árfolyam 2025 végén 90 ezer dollár körül stabilizálódott, miután októberben 126 ezer dolláros csúcsot ért el. A piac most egyetlen kérdésre fókuszál: elérheti-e a Bitcoin az 500 ezer vagy akár az 1 millió dolláros szintet 2030-ra?
2025. 12. 14. 13:00
Megosztás:

Brazília legnagyobb magánbankja Bitcoin-t ajánl: Miért javasol az Itaú Unibanco 3%-os BTC-kitettséget?

Az Itaú Unibanco, Latin-Amerika legnagyobb magántulajdonban lévő bankja merész, de átgondolt ajánlással rukkolt elő: ügyfeleinek azt tanácsolja, hogy 2026-ra portfóliójuk akár 3%-át is fektessék Bitcoinba.
2025. 12. 14. 11:00
Megosztás:

Soha nem látott egészségügyi kockázatfelmérési program indul Gödöllőn

Soha nem látott egészségügyi kockázatfelmérési program indul Gödöllőn és vonzáskörzetében - közölte a kulturális és innovációs miniszter szombaton a Pest vármegyei városban.
2025. 12. 14. 09:00
Megosztás:

Első alkalommal rendeztek jégvirágkarnevált Debrecenben

Első alkalommal rendeztek jégvirágkarnevált Debrecenben szombaton: az augusztusi hagyományos virágkarnevál téli kistestvéreként megtartott fesztiválra több ezren gyűltek össze a cívisváros központjába.
2025. 12. 14. 08:00
Megosztás:

Rekord részvétellel rendeztek Mikulás-ünnepséget Londonban angliai magyar gyerekeknek

Rekord részvétellel rendeztek szombaton Londonban karácsonyváró Mikulás-ünnepséget Angliában élő magyar gyerekeknek.
2025. 12. 14. 07:00
Megosztás:

Jövőre már 116 millió elektromos jármű közlekedik világszerte

A jövő év végéig már mintegy 116 millió elektromos jármű (EV) - személy- és teherautó, busz és furgon - közlekedik a világ útjain - áll a Gartner amerikai technológiai piackutató cég honlapjára felkerült jelentésben.
2025. 12. 14. 06:00
Megosztás:

Szolgálatba lépett az újonnan létrehozott csendőrség Szlovákiában

Szlovákia több városában egyidejűleg léptek szolgálatba péntek éjjel a több évtizednyi szünet után ismét létrehozott csendőrség első járőrei - jelentették szlovák médiaforrások.
2025. 12. 14. 05:00
Megosztás:

Újabb célzott támogatáshoz jutnak a szarvasmarhatartók

Az Agrárminisztérium (AM) az idei, kihívásokkal teli évben is kiemelt stratégiai ágazatként kezeli az állattenyésztést. Ezért a szarvasmarha-ágazat csaknem 6 ezer gazdálkodója számára tette lehetővé, hogy összesen 3,8 milliárd forintnyi hazai forrásból nyújtott támogatáshoz jusson, amely jelentősen hozzájárul a termelők jövedelembiztonságához – jelentette be Nagy István agrárminiszter a szaktráca szombati közleménye szerint.
2025. 12. 14. 04:00
Megosztás:

Hullámzó az építőipar teljesítménye

Az építőipar októberben folytatta az egész évre jellemző hullámzó teljesítményt: a termelés volumene éves összevetésben 9,7%-kal nőtt, ugyanakkor havi alapon 1,9%-kal csökkent. A kedvező éves adat egyrészt az előző évi alacsony bázisnak, másrészt az egyéb építmények – jellemzően állami fejlesztések – körében tapasztalt bővülésnek köszönhető. Pozitívum, hogy az október végi szerződésállomány volumene 50%-kal meghaladta az egy évvel korábbit. Az év első tíz hónapjában a termelés 2,5%-kal felülmúlta a 2024 azonos időszakát, így az ágazat várhatóan pozitív tartományban zárja az évet. Lassú, de fokozatos élénkülésre lehet számítani az ágazatban jövőre. A kilátásokat támogatja, hogy az állami megrendelések várhatóan emelkednek a következő időszakban, emellett az építőipart mind a felújítási piacon keresztül, mind az új építésű lakás-fejlesztéseken keresztül tudja támogatni az Otthon Start Program és az Új Gazdaságpolitikai Akcióterv építőipart és lakáspiacot érintő további intézkedései. Azonban a kilátások szempontjából az uniós források akadozása és a gazdasági szereplők borús jövőképe miatti kapacitás bővítések visszafogása még mindig lassító tényező.
2025. 12. 14. 03:00
Megosztás:

Vége a gáz- és a fatüzelésnek Magyarországon - ez jön helyette

A hagyományos energiahordozók egyre drágábbá válása, valamint az általuk okozott környezeti terhelés következtében mind erőteljesebb az érdeklődés a megújuló energiaforrásokra épülő, korszerű és intelligensen szabályozott hűtési és fűtési megoldások iránt.
2025. 12. 14. 02:00
Megosztás:

Elfogadták a törvényt! Nyugdíjkorhatár Magyarországon 2026-tól

A magyar nyugdíjrendszerrel kapcsolatban az egyik leggyakoribb kérdés, hogy mikortól lehet nyugdíjba menni, és várható-e változás a közeljövőben. Az elmúlt években több lépcsőben emelkedett a nyugdíjkorhatár, ezért sokakat érint, hogy 2026-tól módosul-e a szabályozás, illetve kinek mit jelent mindez a gyakorlatban.
2025. 12. 14. 01:00
Megosztás: