Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Hullámzó az építőipar teljesítménye

Az építőipar októberben folytatta az egész évre jellemző hullámzó teljesítményt: a termelés volumene éves összevetésben 9,7%-kal nőtt, ugyanakkor havi alapon 1,9%-kal csökkent. A kedvező éves adat egyrészt az előző évi alacsony bázisnak, másrészt az egyéb építmények – jellemzően állami fejlesztések – körében tapasztalt bővülésnek köszönhető. Pozitívum, hogy az október végi szerződésállomány volumene 50%-kal meghaladta az egy évvel korábbit. Az év első tíz hónapjában a termelés 2,5%-kal felülmúlta a 2024 azonos időszakát, így az ágazat várhatóan pozitív tartományban zárja az évet. Lassú, de fokozatos élénkülésre lehet számítani az ágazatban jövőre. A kilátásokat támogatja, hogy az állami megrendelések várhatóan emelkednek a következő időszakban, emellett az építőipart mind a felújítási piacon keresztül, mind az új építésű lakás-fejlesztéseken keresztül tudja támogatni az Otthon Start Program és az Új Gazdaságpolitikai Akcióterv építőipart és lakáspiacot érintő további intézkedései. Azonban a kilátások szempontjából az uniós források akadozása és a gazdasági szereplők borús jövőképe miatti kapacitás bővítések visszafogása még mindig lassító tényező.
2025. 12. 14. 03:00
Megosztás:

Vége a gáz- és a fatüzelésnek Magyarországon - ez jön helyette

A hagyományos energiahordozók egyre drágábbá válása, valamint az általuk okozott környezeti terhelés következtében mind erőteljesebb az érdeklődés a megújuló energiaforrásokra épülő, korszerű és intelligensen szabályozott hűtési és fűtési megoldások iránt.
2025. 12. 14. 02:00
Megosztás:

Elfogadták a törvényt! Nyugdíjkorhatár Magyarországon 2026-tól

A magyar nyugdíjrendszerrel kapcsolatban az egyik leggyakoribb kérdés, hogy mikortól lehet nyugdíjba menni, és várható-e változás a közeljövőben. Az elmúlt években több lépcsőben emelkedett a nyugdíjkorhatár, ezért sokakat érint, hogy 2026-tól módosul-e a szabályozás, illetve kinek mit jelent mindez a gyakorlatban.
2025. 12. 14. 01:00
Megosztás:

Zöld utat kapott a Circle kriptobankja – de vételre elég ez?

Fontos mérföldkőhöz érkezett a kriptoszektor: az amerikai pénzügyi felügyelet (OCC) feltételes engedélyt adott a Circle Internet Groupnak és a Ripple-nek nemzeti trust bank létrehozására, miközben a Paxos, a BitGo és a Fidelity Digital Assets meglévő engedélyeit is szövetségi szintre emelte. Ez az öt jóváhagyás egyértelműen jelzi, hogy a digitális eszközökkel foglalkozó vállalatok egyre szorosabban integrálódnak az amerikai bankrendszerbe, immár egységes, szövetségi felügyelet alatt.
2025. 12. 14. 00:05
Megosztás:

Az XRP megtorpan a 2,05 dolláros szint közelében, miközben a Digitap ($TAP) Visa-megállapodása a 2026-os év legjobb szabályozásbarát kriptós előértékesítésévé teszi

A Federal Reserve legutóbbi, 25 bázispontos kamatcsökkentése rövid időre javította a piaci hangulatot, azonban a frissített „dot plot” azt jelezte, hogy az infláció várhatóan 2028-ig a célérték felett marad – ez a fordulat azonnali visszahúzódásokat idézett elő a főbb altcoinok körében.
2025. 12. 13. 23:00
Megosztás:

Ágazatok Második hónapja erősödik az ipar

Az év utolsó negyedévének kezdetén a hazai ipar erősödést mutat, és immár második hónapja tart a növekedés. Októberben az ipari termelés volumene 0,5%-kal meghaladta az előző havit. Ugyanakkor az összkép továbbra sem kedvező, mivel éves összevetésben 2,7%-os visszaesés látható. A feldolgozóipari alágak döntő többségében visszaesett a termelés, a számítógép, elektronikai, optikai termék gyártása és a gép, gépi berendezés gyártása kivételével. A gyenge teljesítmény elsődleges oka a gyenge külső kereslet, ami ráadásul a legnagyobb alágazatokat, a járműgyártást, illetve a villamos berendezés gyártást (akkumulátor-gyártás) kiemelten érinti. Emellett a geopolitikai feszültségek, a vámháború és a gyenge nemzetközi konjunktúra mind rányomta a bélyegét az ágazatra. Az ágazat még messze van a korábbi lendület visszanyerésétől, ugyanakkor az elmúlt hetekben megjelent néhány kedvező fejlemény, amelyek támogatást nyújthatnak a kilábaláshoz. Ezzel szemben a német gazdaság várható élénkülésével kapcsolatos kilátások sajnos tovább romlanak. Remélhetőleg a magyar ipar olyan szegmensekben fog erősödni, amelyek versenyképes termékeket állítanak elő, és az elektromobilitásra épülnek – például a CATL és a BYD gyártási kapacitásainak indulása 2026-ban. Összességében viszont arra számítunk, hogy 2025-ben az ipar teljesítménye várhatóan éves átlagban még visszaesik.
2025. 12. 13. 22:00
Megosztás:

Ezekkel a számokkal nyerhettél az ötös lottón!

A televízióban közvetített számsorsoláson az alábbi nyerőszámokat húzták ki szombaton az ötös lottón:
2025. 12. 13. 21:00
Megosztás:

Az Ethereum a 3 100 dolláros ellenállással küzd, miközben a Digitap ($TAP) egyre magasabbra tör – a 2026-os év legjobb kriptója lehet

Az Ethereum meglepően erőteljesen reagált a hónap eleji FED-ülésre: az ETH árfolyama 3 000 dollár alatti szintről 3 300 dollár fölé emelkedett, mielőtt visszahúzódott a 3 100 dolláros tartományba. Ez a visszahúzódás összhangban áll a medvepiac általános ritmusával, ahol a rövid árfolyamemelkedéseket gyakran nagy lehűlések követik, ahogy a likviditás csökken.
2025. 12. 13. 20:00
Megosztás:

MÁV: jön az éves ország- és vármegyebérlet december közepétől

Vasárnap, december 14-én lép életbe a MÁV-csoport 2025/2026-os menetrendje, december közepétől vásárolható az éves ország- és vármegyebérlet az új MÁVPlusz alkalmazásban, az applikáción keresztül péntektől mindenki számára elérhető a 15 százalékos okoskedvezmény a jegyekre - közölte a MÁV szombaton az MTI-vel.
2025. 12. 13. 19:00
Megosztás:

Az Európai Unió tartósan befagyasztja az orosz állami vagyont

Az uniós tagállamok kormányait tömörítő Tanács úgy döntött, hogy meghatározatlan időre megtiltja az EU területén befagyasztott, az Orosz Központi Bankhoz tartozó eszközök Oroszországba történő visszautalását - közölte a testület pénteken.
2025. 12. 13. 18:00
Megosztás:

Valamikor mostanában áll munkába a százezredik tisztán elektromos gépkocsi

Valamikor mostanában áll munkába a százezredik tisztán elektromos gépkocsi, a teljes klímabarát flotta a múlt hónap végére 98 660 darabot számlált, decemberben kevesebb mint 1400 gépjárműnek kell zöld rendszámot kapnia ahhoz, hogy még idén százezer fölé nőjön az állomány - közölte az Energiaügyi Minisztérium (EM) szombaton facebook jegyzésében.
2025. 12. 13. 17:00
Megosztás:

Stratégiai partnerséget kötött a GLS és a DPD a rugalmasabb csomagátvétel érdekében

A rugalmasabb csomagátvétel érdekében a GLS Hungary és a DPD Hungary stratégiai partnerséget kötött, ennek köszönhetően Magyarországon a DPD-csomagok a GLS-automaták jelentős részéből is átvehetők lesznek - olvasható a két társaság közös, az MTI-nek eljutatott közleményében.
2025. 12. 13. 16:00
Megosztás:

Hitelmoratóriummal segíti a kormány a gazdákat

A fagy- és aszálykár, valamint a sertéspiaci túlkínálat ellensúlyozása érdekében újabb eszközzel segítjük a gazdálkodókat - jelentette be Nagy István agrárminiszter a tárca az MTI-nek küldött szombati közleményében.
2025. 12. 13. 15:00
Megosztás:

Fokozott ellenőrzést tart a rendőrség egy héten át az ország útjain

Fokozott ellenőrzést tart a rendőrség december 15. és december 21. között az ország útjain - közölte az Országos Rendőr-főkapitányság Kommunikációs Szolgálata szombaton a police.hu oldalon.
2025. 12. 13. 14:00
Megosztás:

Ennyit költenek idén karácsonykor a fiatalok: tovább emelkedett az ajándékokra szánt összeg

A 19–29 évesek idén átlagosan 51 ezer forintot költenének karácsonyi ajándékokra – derül ki a K&H ifjúsági index friss adataiból. A férfiak 63 ezer, a nők 40 ezer forintos kiadással terveznek. Bár az ajándékokra szánt összeg tovább emelkedett, a fiatalok 57 százaléka inkább több, kisebb értékű ajándékot vásárolna idén.
2025. 12. 13. 13:00
Megosztás:

A vasárnapig megrendelt Gondosórát még karácsony előtt kézbesítik

Azok a 65 év felettiek, akik vasárnap éjfélig megrendelik a Gondosórát, az ünnepek előtt megkapják - erről beszélt Nyitrai Zsolt, a miniszterelnök főtanácsadója pénteken közzétett Facebook-videójában.
2025. 12. 13. 12:00
Megosztás:

Idő előtt megkezdődött a paksi első betonöntéshez szükséges vasbeton-szerkezet építése

A munkálatok a vártnál gyorsabban haladnak a paksi atomerőmű-bővítésen, s ezzel idő előtt megkezdődhetett az első betonöntéshez szükséges vasbeton-szerkezet építése a helyszínen - közölte Szijjártó Péter külgazdasági és külügyminiszter szombaton Budapesten.
2025. 12. 13. 11:00
Megosztás:

Eljött a hazai professzionális vagyonkezelés ideje

A geopolitikai feszültségek, a kamatkörnyezet hullámzása és az adópolitikai bizonytalanság világszerte újraírják a vagyonkezelés korábbi biztonsági mintáit. – hívja fel a figyelmet Horváth Balázs az SQN Trust igazgatósági tagja. A vagyonos családok egyre gyakrabban szembesülnek azzal, hogy a „biztonságosnak hitt” külföldi struktúrák sem mindig jelentenek védelmet – a banki compliance szigorodik, a transzparencia nő, a bizalmatlanság pedig mindkét irányban erősödik. Márpedig a kérdés minimum 50.000 családot, a vállalkozói munkaadók és adófizetők legfontosabb tizedét érinti.
2025. 12. 13. 10:00
Megosztás:

A Thaiföld és Kambodzsa közötti konfliktus rendezéséről tárgyalt Donald Trump

A Thaiföld és Kambodzsa közötti konfliktus rendezéséről tárgyalt telefonon Donald Trump amerikai elnök a két ázsiai ország miniszterelnökével pénteken.
2025. 12. 13. 09:00
Megosztás:

Így élénkülhet a verseny a szúnyoggyérítés hazai piacán

Nagymértékben csökkent az egyajánlatos közbeszerzési eljárások aránya a szúnyoggyérítési szolgáltatások közbeszerzési (CPV) főcsoportjában az elmúlt években – állapította meg a Gazdasági Versenyhivatal (GVH). A GVH azt is feltárta, hogy a szúnyoggyérítés több szempontból is sajátos piacnak tekinthető, amelyen vannak olyan strukturális problémák, melyek gátolhatják az arány további csökkenését, és amelyek kezelése tovább élénkítheti a versenyt a piacon. A GVH a szúnyoggyérítési piac vizsgálatának lezárásával mindhárom vizsgált közbeszerzési piac kapcsán az egyajánlatos eljárások arányának csökkenését állapította meg.
2025. 12. 13. 08:00
Megosztás: