Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Olcsóbb a hazai üzemanyag, mint a környező országok átlaga

Központi Statisztikai Hivatal adatai alapján 2025 októberében a 95-ös benzin havi átlagára 574 forint volt Magyarországon, ami 4 forinttal alacsonyabb, mint a szomszédos országok 578 forintos átlaga.
2025. 11. 08. 07:00
Megosztás:

Részvényenként 21,81 forint osztalékelőleget fizethet a Duna House

A november 28-i közgyűlés előterjesztése alapján a Duna House (DH) 750 millió forint osztalékelőleget, részvényenként 21,81 forintot fizethet - közölte a társaság pénteken az MTI-vel.
2025. 11. 08. 06:00
Megosztás:

Változtat forgalmazási szerződésein a Coca-Cola a GVH eljárásának eredményeként

A Gazdasági Versenyhivatal (GVH) lezárta a Coca-Cola két magyarországi leányvállalatával szemben indított versenyfelügyeleti eljárását. Az eljárás eredményeként a Coca-Cola HBC Magyarország Kft. vállalta, hogy módosítja a vendéglátóágazati (HORECA) partnereivel kapcsolatban alkalmazott mintaszerződéseit, melyeket tisztázó rendelkezésekkel egészít ki. A vállalkozás emellett belső képzésekkel fogja biztosítani a módosításoknak és az általános versenyjogi szabályoknak való megfelelést. A vállalások jelentősen növelhetik a versenyt az érintett piacokon.
2025. 11. 08. 05:00
Megosztás:

Az otthon start első hulláma után letisztult a piac

Az Otthon Start Program (OSP) bejelentését követően látványos, de kétségtelenül túlfűtött érdeklődési hullám indult el az ingatlanpiacon. A Duna House elemzése alapján az augusztus eleji hetekben a hirdetésekre érkező telefonos megkeresések száma több mint 60%-kal emelkedett a júliusi átlaghoz képest. A hirtelen jött aktivitás mögött azonban jelentős arányban olyan érdeklődők álltak, akik nem rendelkeztek valódi vásárlási szándékkal vagy megfelelő pénzügyi háttérrel.
2025. 11. 08. 04:00
Megosztás:

Porsche árából épülnek zöld parkok Magyarországon

Luxustermékekből születhetnek új karbonnegatív parkok. Forradalmasítja a közösségi finanszírozást a Green Connect, amely egy több pilléren nyugvó, innovatív fenntarthatósági szemléletű program. Ez a program egyszerre szolgálja a természet regenerálását, a fenntartható és karbonnegatív építészet előmozdítását, a digitális fenntarthatóság megoldásainak elterjesztését, valamint a zöld gazdaság és a közösségi fenntarthatóság fejlesztését.
2025. 11. 08. 03:00
Megosztás:

Jövőre a bankunk megmondja, hogy melyik számlával tudnánk spórolni. De mennyi lehet ez a megtakarítás?

Az MNB elvárásai alapján a bankok jövő év elején (az éves díjkimutatással együtt) tájékoztatni fogják ügyfeleiket arról, hogy van-e számukra kedvezőbb számlacsomag az adott pénzintézetnél és mennyit spóroltak volna, ha azt a számlát használnák. De kik fognak ilyen értesítést kapni? Mennyit nyerhetnek az emberek, ha áttérnek a bank által kiküldött számlacsomagra? Lehet ennél többet is spórolni?
2025. 11. 08. 02:00
Megosztás:

Honnan tudhatom, hogy rákos lehetek? A biológiai életkor előre jelezheti ezt

A biológiai életkor jelzi előre a rák kockázatát – új kutatások a fiatal felnőttek vastagbélrákjáról. Hogyan mehetünk elébe a problémának? Egy magyar klinika megoldása most jelentős segítséget nyújthat.
2025. 11. 08. 01:00
Megosztás:

Hány forint lesz az EURÓ és a dollár rövid és közép távon?

Fedezze fel, merre tart a pénz világa – ingyenes online befektetési szeminárium a VIG Alapkezelő szakértőivel!
2025. 11. 08. 00:01
Megosztás:

XRP árfolyam-előrejelzés 3 dollárra csökkent, miközben a Digitap ($TAP) 10 dolláros célja a Visa hírével együtt erősödik

A kriptopiac közelmúltbeli lassulása miatt a kereskedők egyre inkább azt találgatják, mi következik az XRP számára. Hosszú hetek oldalazó mozgása után, egy kulcsfontosságú ellenállási szint közelében, még a pozitív hangulat is halványulni látszik. Vajon a Ripple által ígért pozitív lendület elegendő lesz a bikák visszacsábításához, vagy most már elkerülhetetlen a 3 dolláros felső határ?
2025. 11. 07. 23:00
Megosztás:

Látja a NAV a külföldi kriptovaluta ügyleteket?

A NAV előtt sem marad titokban a külföldi kriptozás: az Országgyűlés elé nemrég olyan törvényjavaslatok kerültek, amelyek célja, hogy a kriptoeszközökre vonatkozó nemzetközi információcsere szabályait beemeljék a magyar jogrendbe.
2025. 11. 07. 22:00
Megosztás:

10 újdonság, amit a magyar revolutosok megkaphatnak a közeljövőben

Érkeznek a hírek a sajtóban arról, hogy a Revolut megnyitotta a magyarországi fióktelepét. De azt már kevesen tudják, hogy az jogilag már évek óta létezik, így holnaptól még nem fog megváltozni semmi. A BiztosDöntés.hu viszont összeszedte azokat az újdonságokat, melyeket megkaphatnak majd a magyarországi revolutos ügyfelek a közeljövőben, a fióktelepi működés elindulásával.
2025. 11. 07. 21:00
Megosztás:

Hosszú távú kriptobefektetési útmutató: Digitap ($TAP) ütemterv, felhasználói metrikák és a 100-szoros növekedés útja

A vagyonépítés a kriptovilágban ritkán valósul meg rövid távú felhajtással – a hosszú távú hasznosság rendszerint túlszárnyalja a spekulációt. Azok a befektetők, akik korábban mémcoinokat és spekulatív tokeneket hajszoltak, most egyre inkább a fenntartható, valós felhasználási esettel rendelkező projektek felé fordulnak.
2025. 11. 07. 20:00
Megosztás:

Zcash - minden, amit tudni érdemes az új kriptovaluta sztárról

Ahogy közeledünk 2026-hoz, a kriptopénzek világában ismét felértékelődik az adatvédelem fontossága. A Zcash – egykor rétegtechnológiának számító projekt – mára teljes értékű, titkosított pénzügyi hálózattá fejlődött, amely matematikai bizonyítékokkal garantálja a tranzakciós magánszférát. De hogyan vált a Zcash a Bitcoin privát alternatívájává? És vajon készen áll-e arra, hogy méretezhető, kvantumbiztos titkosított pénzként hódítson tovább?
2025. 11. 07. 19:00
Megosztás:

Lassult a kiskereskedelmi forgalom növekedése Csehországban

Szeptemberben éves szinten 2,6 százalékkal nőtt a kiskereskedelmi forgalom Csehországban. Augusztusban ez a mutató 3,3 százalékos volt. Augusztushoz viszonyítva pedig 0,2 százalékkal csökkent a kiskereskedelmi forgalom – közölte a Cseh Statisztikai Hivatal pénteken honlapján.
2025. 11. 07. 18:00
Megosztás:

Két útfelújítás fejeződött be Dél-Békésben

Megújult a Nagybánhegyest Kaszaperrel és Mezőkovácsházával összekötő 4441-es jelű út 1,3 kilométeres, valamint a 4437-es jelű Nagykamarás-Kunágota összekötő út 775 méteres szakasza - hangzott el pénteken Almáskamaráson.
2025. 11. 07. 17:30
Megosztás:

Felpattanás a Bitcoin ETF-ek piacán: Hatnapos kiáramlás után 240 millió dollár érkezett vissza

Fordulat történt az amerikai Bitcoin ETF-piacon: hat egymást követő napon át tartó tőkekiáramlást követően 240 millió dollárnyi friss tőke áramlott vissza a legnagyobb spot Bitcoin ETF-ekbe. A befektetői hangulat tehát javulni látszik egy turbulens hét után, amikor a makrogazdasági bizonytalanságok dominálták a piacot. Mi áll a változás mögött? És mi a helyzet az Ether és Solana ETF-ekkel? A részleteket alább mutatjuk.
2025. 11. 07. 17:00
Megosztás:

Új lendület a Bitgetnél: Ignacio Aguirre Franco lett a vállalat globális marketingigazgatója (CMO)

A Bitget, a világ legnagyobb Universal Exchange-e (UEX), tovább erősíti globális márkanarratíváját és felhasználói elköteleződési stratégiáját Ignacio Aguirre Franco kinevezésével, aki a vállalat új Marketingigazgatója (CMO) lett.
2025. 11. 07. 16:30
Megosztás:

Év végi kötelezőkampány: 32 900 forintos átlagdíjon kötik az új szerződéseket

Az Insura.hu biztosításközvetítő adatai szerint a november 2-án megkezdődött év végi kgfb-kampány első napjaiban a személygépkocsival rendelkező ügyfelek 32 900 forintos átlagdíjon kötöttek új szerződést. Ez az összeg gyakorlatilag megegyezik az egy évvel korábban tapasztalt 33 ezer forintos szinttel, vagyis a biztosítók tavalyhoz képest összességében nem emeltek a díjaikon.
2025. 11. 07. 15:30
Megosztás:

Intézményi fordulópont előtt a Dogecoin? Bitwise váratlan húzása spot ETF-et hozhat a piacra

A kriptovilág újabb mérföldkőhöz érkezhet: a Bitwise egy merész lépéssel megindította a Dogecoinra vonatkozó spot ETF bevezetésének folyamatát az Egyesült Államokban. A döntés nemcsak a memecoinként ismert DOGE intézményesedését gyorsíthatja fel, hanem precedenst teremthet más altcoinok számára is. A cikkben bemutatjuk, miért különösen jelentős ez a kezdeményezés, hogyan működik a gyorsított eljárás, és mit jelenthet ez a kriptopiac számára.
2025. 11. 07. 15:00
Megosztás:

Tizenöt éve a BÉT-en az ALTEO Nyrt.

Tőzsdei jelenlétének 15 éves jubileumát ünnepelte az ALTEO Nyrt. a Budapesti Értéktőzsdén.
2025. 11. 07. 14:30
Megosztás: