Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Február 1-től 300 ezer forintot lehet ingyenesen felvenni

A kormány a családok érdekeit szem előtt tartva február 1-től duplájára, azaz 150 ezer forintról 300 ezer forintra emelte az ingyenes készpénzfelvétel értékhatárát - tájékoztatta a Nemzetgazdasági Minisztérium (NGM) vasárnap közleményben az MTI-t.
2026. 02. 01. 15:00
Megosztás:

Összeomlás fenyegeti az Ethereumot? BitMine 6 milliárd dolláros veszteséget szenvedett el

Az egyik legnagyobb Ethereum befektető (treasury) cég csapdába esett – megindulhat az eladás lavinája?
2026. 02. 01. 14:00
Megosztás:

Növekvő forgalomban emelkedett a BUX a héten

A Budapesti Értéktőzsde (BÉT) részvényindexe, a BUX a múlt péntekihez képest 3,01 százalékkal emelkedve 128 831,58 pontos történelmi csúcson fejezte be a hetet.
2026. 02. 01. 13:00
Megosztás:

Ön ezt észrevette? Csökkent a sertéshús kiskereskedelmi beszerzési ára az év elején

Csökkent a vágósertés termelői ára, a nyers sertéshúsok feldolgozói értékesítési és kiskereskedelmi beszerzési ára, alig változott viszont a baromfi termelői és a tojás csomagolóhelyi ára - olvasható az Agrárközgazdasági Intézet (AKI) honlapján közzétett összesítésekben.
2026. 02. 01. 11:00
Megosztás:

GSM-napot rendeznek a szegedi Informatika Történeti Kiállításon

A csaknem negyedszázada használaton kívüli első generációs mobiltelefonjukat is újra kipróbálhatják a látogatók a február 14-i GSM-napon, amelyet a szegedi Informatika Történeti Kiállításon rendeznek meg a Szent-Györgyi Albert Agórában - tájékoztatta a szervező Neumann János Számítógép-tudományi Társaság az MTI-t.
2026. 02. 01. 10:00
Megosztás:

Így vehetsz fel havi 300 ezer forint készpénzt mától bankautomatából

Mától fontos változás lép életbe a bankautomatáknál: az ingyenes készpénzfelvétel több mint tíz éve fennálló, havi 150 ezer forintos limitje a duplájára emelkedik, így mostantól már 300 ezer forintot is felvehetünk díjmentesen. Az ingyenes készpénzfelvétel egyéb feltételei azonban változatlanok maradnak – derül ki a Bank360 közleményéből.
2026. 02. 01. 09:00
Megosztás:

Nagy István: hamarosan lehet csatlakozni a mezőgazdasági krízisbiztosítási rendszerhez

Az elmúlt év komoly kihívások elé állította a mezőgazdasági termelőket: a kiszámíthatatlan klímakörnyezet, a járványos állatbetegségek megjelenése és a piaci krízisek ismételten ráirányították a figyelmet a gazdálkodói tudatosság, illetve a mezőgazdasági kockázatkezelés jelentőségére. A termelői kockázatok mérséklése érdekében megéri csatlakozni az uniós szinten egyedülálló mezőgazdasági krízisbiztosítási rendszerhez, amelyre idén is február 1. és február 28. között van lehetőségük a gazdálkodóknak - jelentette be Nagy István agrárminiszter szombaton a közösségi oldalán.
2026. 02. 01. 08:00
Megosztás:

Kihirdették a Magyar Természettudományi Múzeum gyűjteményi központjára kiírt építészeti tervpályázat nyerteseit

Kihirdették a Magyar Természettudományi Múzeum új debreceni gyűjteményi központjára kiírt nemzetközi építészeti tervpályázat eredményét: a tervpályázat nyertese a Sordo Madaleno Ltd., az Építész Stúdió Kft. és a Buro Happold Ltd. konzorciuma lett, "amelynek terve egyetlen, tömör, határozott téglalap alakú tömegként jelenik meg, racionális belső térszervezéssel és rétegzett, masszív homlokzattal, amely reflektál a régió geológiai adottságaira - jelentették be a város és a múzeum vezetői sajtótájékoztatón pénteken Debrecenben.
2026. 02. 01. 07:00
Megosztás:

A fogyasztók új értéket keresnek: átalakul az autóipar jövője

A globális autóipar történetének egyik legátfogóbb átalakulásán megy keresztül, amelyet a fogyasztói elvárások gyökeres változása vezérel. A Deloitte legfrissebb, 2026-os globális gépjárműfogyasztói tanulmányában (Global Automotive Consumer Study) a szakértők rávilágítanak, hogy a vásárlók egyre inkább az értéket, a hozzáférést és az élményt helyezik előtérbe, miközben az elektromos járművek (EV) iránti kereslet és a márkahűség is új utakat tör.
2026. 02. 01. 06:00
Megosztás:

Horvát kormányfő: az EU nem hagyhatja magára Délkelet-Európát

Délkelet-Európa olyan térség, amelyet az Európai Uniónak nem szabad elhanyagolnia, és nem maradhat kitéve más globális szereplők befolyásának - írta Andrej Plenkovic horvát miniszterelnök az X-en, miután szombaton Zágrábban megbeszélést folytatott Friedrich Merz német kancellárral az Európai Unió bővítésének jövőjéről és a térség európai perspektívájáról.
2026. 02. 01. 05:00
Megosztás:

Újabb bankoknál drágulnak a vállalkozói számlák

A Raiffeisen Bankot követően újabb három pénzintézet jelentette be, hogy április elsejétől megemeli a vállalkozói bankszámlák költségét. A lakossági ügyfelek biztonságban vannak, de úgy tűnik csak átmenetileg.
2026. 02. 01. 04:00
Megosztás:

5 csodálatos gyógyhatás, amit a szódabikarbónáról nem is tudtál!

Sokan csak sütéshez vagy takarításhoz ismerik, pedig a szódabikarbóna (nátrium-hidrogén-karbonát) bizonyos helyzetekben kifejezetten „orvosi logikával” működik: savakat semlegesít, pH-t emel, és ezzel érdemi élettani hatásokat válthat ki.
2026. 02. 01. 02:00
Megosztás:

A nyugdíjak számításakor az 1998-as év a nagy vízválasztó! Önnek jól számoltak?

1998 valódi vízválasztó a nyugdíjszámításban: a felsőfokú tanulmányok nem növelik automatikusan a szolgálati időt.
2026. 02. 01. 01:00
Megosztás:

Az országgyűlési képviselők benyújtották vagyonnyilatkozataikat

A 2026. január 31-i határidőig az országgyűlési képviselők, a nemzetiségi képviselő és a nemzetiségi szószólók eleget tettek - a 2025. december 31-én fennálló vagyoni állapotra vonatkozó - vagyonnyilatkozat-tételi kötelezettségüknek - közölte Hargitai János, az Országgyűlés Mentelmi Bizottságának elnöke szombaton az MTI-vel.
2026. 01. 31. 23:00
Megosztás:

120 000 tárca választotta a Digitap ($TAP) tokent a 0,609 dolláros Aster helyett – Ez lehet a legjobb kriptovaluta, amit most érdemes megvásárolni

Ahogy a kriptopiac egyre mélyebbre lép 2026-ban, a befektetők már nem az alapján értékelik a tokeneket, hogy mit képviseltek a múltban, hanem hogy mire használják őket aktívan a jelenben. Ez az elmozdulás egyre nyilvánvalóbb, különösen, ha összehasonlítjuk az Aster (ASTER) és a Digitap ($TAP) helyzetét.
2026. 01. 31. 22:00
Megosztás:

A HONOR gyorsuló növekedése Kelet-Közép-Európában

A HONOR, mint globális technológiai márka, amely az okos mobileszközök fejlesztésére és innovációjára fókuszál, továbbra is dinamikus növekedést mutat a nemzetközi piacokon.
2026. 01. 31. 21:00
Megosztás:

A Digitap ($TAP) 263%-ot emelkedett és lekörözi a 120 dolláros SOL-t: Miért nyerők a kriptó előértékesítések januárban?

A <a href="https://presale.digitap.app?&utm_campaign=jan&utm_content=com&utm_medium=pr&utm_source=prof-pr&utm_term=3170a" target="_blank">Digitap ($TAP)</a> nagyjából 263%-os emelkedést ért el korai árképzési szakaszához képest, miközben a SOL 120 dollár körül forog, de nem tud hasonló lendületet felmutatni. Ez az ellentét megváltoztatja a befektetők piaci szemléletét.
2026. 01. 31. 20:00
Megosztás:

Újraválasztották a VOSZ főtitkárát

A Vállalkozók és Munkáltatók Országos Szövetségének Elnöksége 2026. január 28-i ülésén Perlusz Lászlót további 5 évre a VOSZ főtitkárává választotta.
2026. 01. 31. 19:00
Megosztás:

XIV. Leó sem költözik be a pápai lakosztályba

Elődjéhez, Ferenc pápához hasonlóan XIV. Leó is úgy döntött, hogy nem költözik be a vatikáni paloták pápai lakosztályába, hanem egyszerűbb, személyre szabott otthont alakít ki magának.
2026. 01. 31. 18:00
Megosztás:

MVM: a rezsistop révén egyszeri, 30 százalékos kedvezmény biztosított a lakosságnak

Az MVM a januári rezsistopra vonatkozó kormánydöntést végrehajtva egyszeri, 30 százalékos mennyiségi kedvezményben részesíti a lakossági áram- és gázfelhasználókat - közölte a szolgáltató szombaton az MTI-vel.
2026. 01. 31. 17:00
Megosztás: