Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Ethereum árfolyam-előrejelzés: Jön az 5 000 dollár? A Ripple küszködik, miközben a Digitap 219%-ot ralizik – Egy új csillag születőben

Az utóbbi időben az Ethereum és a Ripple árfolyama is ingadozást mutatott. Mindkettő esetében csökkenő mozgás volt tapasztalható, ami aggodalomra adott okot egyes kereskedők számára. Ugyanakkor ismert influenszerek, mint Don és Javon Marks úgy vélik, hogy ezek a tokenek hamarosan kilőnek. Don például azt gondolja, hogy az ETH akár 5 000 dollárig is emelkedhet.
2025. 12. 31. 20:00
Megosztás:

Hideg idővel indul az új év

A jövő év hideg, főként az ország déli felén csapadékos idővel kezdődik - írta a HungaroMet Zrt. szerdai agrometeorológiai elemzésében.
2025. 12. 31. 19:00
Megosztás:

A naperőművekhez hasonló szintlépés kell az energiatárolásban is

"Napelem-forradalom után tárolói forradalom jön!" 2010-ben Magyarországon még alig 300 naperőmű működött, a számuk ma már 320 ezer felett jár, most hasonló szintlépés kell az energiatárolásban is - közölte Czepek Gábor, az Energiaügyi Minisztérium (EM) parlamenti államtitkára kedden Facebook-oldalán.
2025. 12. 31. 18:00
Megosztás:

A Bitcoin 5%-os veszteséggel zárja 2025-öt – a türelmetlen befektetők veszteséggel szállnak ki

A Bitcoin árfolyama visszafogott mozgással búcsúzik 2025-től. Az év utolsó heteiben szűk sávban oldalazott a piac, ami ugyan csökkentette a hirtelen kilengések esélyét, de sok befektető számára komoly csalódást jelentett a várt lendület elmaradása.
2025. 12. 31. 17:00
Megosztás:

Az EU aggodalmát fejezte ki a Tajvan körüli kínai hadgyakorlat miatt

Az Európai Unió aggodalmát fejezi ki a Tajvan körül tartott kínai hadgyakorlat miatt, amely tovább növeli a feszültséget a térségben, és veszélyezteti a nemzetközi békét és stabilitást - közölte kedden az Európai Unió külügyi szolgálata.
2025. 12. 31. 16:00
Megosztás:

A GVH 2025-ben 29 vállalkozással szemben több mint 3,7 milliárd forint bírságot szabott ki

Miközben több mint 3,3 milliárd forint bírságcsökkentést adott a Gazdasági Versenyhivatal (GVH) az együttműködő és jogkövetésre törekvő vállalkozásoknak 2025-ben, addig a hivatal versenytanácsa 29 vállalkozással szemben 3 milliárd 782,6 millió forint bírságot szabott ki - közölte a GVH kedden az MTI-vel.
2025. 12. 31. 15:00
Megosztás:

Román tulajdonba kerül a leállított vajdahunyadi kohászati kombinát

Az UMB Steel tulajdonába kerül a leállított vajdahunyadi kohászati kombinát - írta az economica.net a vállalat közleménye alapján.
2025. 12. 31. 14:00
Megosztás:

Hová utazik a legtöbb magyar szilveszterkor? Mutatjuk!

Eger, Pécs és Szeged a szilveszterezők körében legnépszerűbb hazai település a Szallas.hu friss adatai szerint. A vendégek zöme 2–3 éjszakára marad, és 170 ezer forint alatt fizet a szállásért. A szállástípusok versenyét az apartmanok nyerik.
2025. 12. 31. 13:00
Megosztás:

Lézershow és fényjáték lesz szilveszterkor több erdélyi városban

Tűzijáték helyett lézershow-val és fényjátékkal köszöntik a 2026-os évet több erdélyi városban szilveszterkor. Egyes önkormányzatok állatvédelmi szempontokkal indokolták a váltást, máshol anyagi okokból marad el a tűzijáték.
2025. 12. 31. 12:00
Megosztás:

Lengyelországban több helyszínen tartottak tüntetéseket a Mercosur-megállapodás ellen

Közúti tiltakozásokat szerveztek a gazdák Lengyelország több pontján az Európai Unió (EU) és a dél-amerikai Mercosur-országok közötti szabadkereskedelmi megállapodás megkötése ellen.
2025. 12. 31. 11:00
Megosztás:

Gyengült a forint szerda reggelre

Gyengült a forint szerda reggelre a kedd esti jegyzéséhez képest a főbb devizákkal szemben a nemzetközi devizakereskedelemben. A forint az idén összességében erősödött a főbb devizákkal szemben.
2025. 12. 31. 10:00
Megosztás:

Jóval többet költhetnek lakáshitelük kedvezményes törlesztésére az egészségpénztári tagok

Több mint tizedével nő 2026-ban a lakáshitelek törlesztésére, illetve a beiskolázásra fordítható egészségpénztári megtakarítások összege is, miután a minimálbér 11 százalékkal emelkedik – hívja fel a figyelmet a BiztosDöntés.hu pénzügyi szakújságírója.
2025. 12. 31. 10:00
Megosztás:

Több, mint 4,1 milliárd forintot hajtott a GVH a magyar embereknek és vállalkozásoknak

Több mint 3,3 milliárd forint bírságcsökkentést adott a Gazdasági Versenyhivatal (GVH) az együttműködő és jogkövetésre törekvő vállalkozásoknak 2025-ben. Ez az összeg így a magyar gazdaságban maradt. A magyar emberek további, mintegy 800 millió forint értékű közvetlen kompenzációt is kaptak a jogsértéseket elkövetett vállalkozásoktól a GVH eljárásainak köszönhetően. A nemzeti versenyhatóság 2025-ben is kiemelt figyelmet fordított a globális technológiai vállalkozások, valamint az élelmiszer-kiskereskedelmi cégek vizsgálatára.
2025. 12. 31. 09:00
Megosztás:

Minden eddiginél többet neteztek és streameltek az év utolsó hónapjában

Jelentősen meghaladta a Magyar Telekom decemberi vezetékes- és mobilinternet forgalma az előző év azonos időszakát. A növekedést a Magenta Moments kalendárium kedvezményei, a korlátlan mobilnet-ajánlatok és a november végén meghirdetett 3 hónapos díjmentes Disney+ előfizetés is fokozták. Az ünnepi időszakon kívül az év során több kiemelkedő gaming- és sportesemény, valamint új sorozatévad is hozzájárult a forgalmi csúcsokhoz.
2025. 12. 31. 08:00
Megosztás:

Albérletpiac 2026: nincs okuk pezsgőt bontani a bérbeadóknak

Az Otthon Start Program tartós ársapkát húzott a budapesti albérletpiacra szeptember óta, amely 2026-ban és akár azt követően is korlátozhatja majd a bérleti díjak emelkedését – derül ki a Rentingo friss albérletpiaci előrejelzéséből. A bérbeadó platform szerint a budapesti használt lakások felértékelődési potenciálja erősen csökkent, ezért arra lehet számítani, hogy jövő évben bezuhan a tisztán piaci alapon történő befektetési célú lakásvásárlások száma. A bérbeadók számára különösen a 250 ezer forint feletti árszinten maradhat nehéz a terep, miközben a választási évben a bérlők jövedelmi helyzete javulhat, ami az alsóbb árkategóriákban várhatóan stabilizálja a keresletet.
2025. 12. 31. 07:00
Megosztás:

Az év utolsó napjaiban rekordot dönt a snackek iránti kereslet a Kifli.hu-n

A szilveszter a snackek egyik legnagyobb bevételt generáló időszaka a Kifli.hu online szupermarketben. Az év utolsó napjaiban, december 28–31. között a snackek forgalma az év többi napjához képest akár háromszorosára is megugrik. A kategória éves árbevétele meghaladja a 97 millió forintot, ami jól mutatja, hogy a snackek népszerűsége nem csupán a szezonális csúcsidőszakoknak köszönhető.
2025. 12. 31. 06:00
Megosztás:

Pályaválasztás, diploma, jövő – mire érdemes figyelni az egyetemválasztásnál?

Magyarországon közel 330 ezer hallgató (KSH) tanul felsőoktatásban, és a friss diplomások mintegy 90%-a (Education and Training Monitor 2025) rövid időn belül el tud helyezkedni. A diploma ma is érték, a kérdés az, hogy a gyorsan változó világban mit érdemes tanulni.
2025. 12. 31. 05:00
Megosztás:

Strukturális fordulópont előtt a piacok 2026-ban

2026 küszöbén a globális befektetési környezet összességében kedvezően alakul a kockázatos eszközök számára. A növekedés stabil maradhat, a monetáris és fiskális politikák pedig várhatóan támogatóak lesznek. Bár az elmúlt évben számos piaci aggodalom került előtérbe – a makacs alapinflációtól a vámok potenciális hatásáig –, ezek egy része mára mérséklődött. A Fidelity International elemzői szerint azonban a strukturális átalakulások továbbra is érdemi figyelmet igényelnek: ide tartoznak az AI-vezérelt beruházási trendek, a globális fragmentáció erősödése, a Fed függetlenségét övező kérdések, a részvénypiac koncentrációja és a dollár várható leértékelődése.
2025. 12. 31. 04:00
Megosztás:

Melyik faj lesz az év hala 2026-ban?

A Magyar Haltani Társaság felhívja a figyelmet, hogy már csak az utolsó napok maradtak az Év hala 2026 szavazáson való részvételre. A voksokat december 31-én, déli 12 óráig lehet leadni a társaság honlapján. A nyilvános választás célja idén is őshonos halfajaink megismertetése és népszerűsítése. Most dől el, melyik halfaj viselheti 2026-ban az Év hala címet.
2025. 12. 31. 03:00
Megosztás:

Így lehetséges a 100%-os bér- és nyugdíjemelés Magyarországon

Az Alternatív Szabadság Párt (ASP) bemutatta átfogó gazdasági modelljét, amely a progresszív adózás, a profitkivét magasabb megadóztatása és az állami kiadások átcsoportosítása révén fedezetet teremt a 100%-os bér- és nyugdíjemelésre, valamint a családi támogatások jelentős növelésére. A párt szerint a jelenlegi, pazarló közbeszerzési és kormányzati kommunikációs kiadások visszavágásával több ezer milliárd forint szabadítható fel. Az ASP hangsúlyozta: nem megszorításokkal, hanem igazságosabb közteherviseléssel és hatékonyabb állami működéssel kívánja javítani a magyarok életszínvonalát.
2025. 12. 31. 02:00
Megosztás: