Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Bővül az otthontámogatásban részesülő közszolgálati dolgozók köre

Közszolgálatban dolgozók figyelem! Tovább bővül az otthontámogatásban részesülők köre, és meghosszabbítottuk a bejelentési határidőt is - mondta Hidvéghi Balázs, a Miniszterelnöki Kabinetiroda parlamenti államtitkára csütörtökön közzétett Facebook-videójában.
2026. 01. 23. 02:30
Megosztás:

Tisztázzuk a félreértéseket az M1 regionális matrica kapcsán

Az M1 regionális e-matrica kapcsán még mindig sok helyen és esetben jelenik meg téves vagy nem egyértelmű információ, amelyet szükséges tisztázni az idei évtől bevezetett új matricatermék kapcsán – közölte az útdíjfizetési szolgáltató. A terméket bárki megvásárolhatja, és mind a négy az M1 autópályával érintett vármegye összes díjköteles útjára érvényes a jogosultság – hívta fel a figyelmet a Magyar Közút Nonprofit Zrt. Útdíj Üzletága.
2026. 01. 23. 02:00
Megosztás:

Rendszer-újraindítás az IT-szektorban: Újra pörög a tech-piac, de a bértranszparencia felülírja az eddig ismert szabályokat

Három évnyi bizonytalanság után az IT-szektor megnyomta a reset gombot: a No Fluff Jobs legfrissebb, 2025-ös béradatokat összegző Salary Guide riportja szerint a tech szektor ismét növekedési pályára állt, miközben a bértranszparencia visszavonhatatlanul átveszi az irányítást a piacon.
2026. 01. 23. 01:30
Megosztás:

Felgyorsultak a kifizetések a magyar agráriumban

Felgyorsultak a kifizetések a magyar agráriumban. Már több mint 730 milliárd forint értékben születtek támogatói döntések, amelyek összege a közeljövőben az 1000 milliárd forintot is meghaladhatja a beruházási típusú pályázatok esetében. A fejlesztések érdemben erősítik a magyar agrárium versenyképességét - jelentette ki Viski József államtitkár a Gabonatermesztők Országos Szövetségének Szántóföldi Szakmai Napján, az Agromashexpón az Agrárminisztérium csütörtöki közleménye szerint.
2026. 01. 23. 01:00
Megosztás:

Az ALTEO új energetikai befektetéssel bővíti portfólióját

Az ALTEO Energiaszolgáltató Nyrt. adásvételi szerződést írt alá a DEPO Erőmű Kft. 100 százalékos üzletrészének megvásárlásáról a Plant Industrial Engineering Kft.-vel - közölte az energetikai szolgáltató és kereskedő vállalat csütörtökön a BÉT honlapján.
2026. 01. 23. 00:30
Megosztás:

Aláírták a Béketanács alapító okiratát

Megalakult csütörtökön Davosban a Donald Trump amerikai elnök kezdeményezésére életre hívott Béketanács; az alapító okiratot mások mellett Orbán Viktor miniszterelnök is aláírta.
2026. 01. 23. 00:05
Megosztás:

Trump szerint az USA mindent elért, amit Grönlanddal kapcsolatban célként kitűzött

Az Egyesült Államok mindent elért, amit Grönlanddal kapcsolatban célként kitűzött - jelentette ki Donald Trump amerikai elnök csütörtökön Davosban.
2026. 01. 22. 23:30
Megosztás:

Ezekkel a számokkal nyerhettél a hatos lottón!

A Szerencsejáték Zrt. tájékoztatása szerint a 4. héten megtartott hatos lottó számsorsoláson a következő számokat húzták ki:
2026. 01. 22. 23:00
Megosztás:

Minden eddiginél több támogatás pörgeti fel a földhő hasznosítását

Minden eddiginél több támogatás pörgeti fel a földhő hasznosítását - közölte az Energiaügyi Minisztérium (EM) csütörtökön az MTI-vel.
2026. 01. 22. 22:30
Megosztás:

Saylor a „nagyobb narancsra” figyel, miközben a Digitap ($TAP) integrálja a Solana hálózatot: A legjobb kripto 2026-ra?

A mélypontokon történő vásárlás továbbra is bevett és sikeres stratégia a nagybefektetők körében. Michael Saylor, a Strategy elnöke nemrégiben az X-en tett utalást következő nagy Bitcoin-vásárlásukra, miután a BTC újabb meredek esést szenvedett el $90 000 alá.
2026. 01. 22. 22:00
Megosztás:

Több mint 45 ezren fordultak tünetekkel orvoshoz a múlt héten

A múlt héten 45 700-an fordultak influenzaszerű tünetekkel orvoshoz - közölte honlapján a Nemzeti Népegészségügyi és Gyógyszerészeti Központ (NNGYK) csütörtökön. Ez valamivel több, mint az azt megelőző heti 42 500 beteg.
2026. 01. 22. 21:30
Megosztás:

Enyhít szorításán a fagy és többfelé várható csapadék a hétvégén

A hétvégére megszűnnek a kemény éjszakai fagyok és napközben is általában fagypont felett alakulnak a maximum-hőmérsékletek, vasárnap akár plusz 9 Celsius-fok is lehet. Az enyhüléssel párhuzamosan csapadék is érkezik, többfelé kell ónos esőre, esőre, havas esőre számítani - derül ki a HungaroMet Nonprofit Zrt. előrejelzéséből, amelyet csütörtökön juttattak el az MTI-hez.
2026. 01. 22. 21:00
Megosztás:

Milyen csúcsokat érhet el a Cardano és a Solana ebben a negyedévben? A bálnák a Digitap felé fordulnak a 251%-os árfolyamemelkedés nyomán

Miközben a kereskedők próbálják megtippelni, hogy a Cardano és a Solana ára milyen szintre emelkedhet ebben a negyedévben, az on-chain adatok azt mutatják, hogy a bálnák már másfelé mozognak.
2026. 01. 22. 20:00
Megosztás:

Erősödött a forint csütörtök estére

Erősödött a forint a főbb devizákkal szemben csütörtökön kora estére a bankközi devizapiacon reggelhez képest.
2026. 01. 22. 19:30
Megosztás:

Az elektromos autó a magasabb jövedelműek járműve Németországban

Az elektromos autók és a plug-in hibridek németországi elterjedése továbbra is erősen jövedelemfüggő: minél magasabb egy háztartás nettó jövedelme, annál nagyobb az esélye annak, hogy elektromos meghajtású járművet tart - derül ki a német szövetségi statisztikai hivatal, a Destatis kimutatásából.
2026. 01. 22. 19:00
Megosztás:

Ezek húzzák a GDP-t 2026-ban

Idén az első fél évben főként a fogyasztás, a második fél évtől kezdve pedig a beruházások támogatják majd a bruttó hazai termék (GDP) növekedését - mondta a Nemzetgazdasági Minisztérium (NGM) szóvivője az Oeconomus Gazdaságkutató Alapítvány csütörtöki budapesti sajtóbeszélgetésén.
2026. 01. 22. 18:30
Megosztás:

Mezőgazdasági szempontból kedvező a hideg idő

Mezőgazdasági szempontból kedvező volt eddig a januári időjárás az országos, tartósan megmaradó hóval és komoly hidegekkel, de elősorban az Alföldön nagy területen továbbra is száraz a talaj, így ott további csapadékra lenne szükség - írta a HungaroMet Zrt. csütörtöki agrometeorológiai elemzésében.
2026. 01. 22. 18:00
Megosztás:

Az Európai Parlament elutasította az Európai Bizottság elleni bizalmatlansági indítványt

Elutasította az Európai Bizottság ellen benyújtott bizalmatlansági indítványt az Európai Parlament csütörtökön. A javaslatot 165 képviselő támogatta, 390-en ellene szavaztak, 10-en tartózkodtak.
2026. 01. 22. 17:30
Megosztás:

Nagy-Britannia egyelőre nem csatlakozik a Béketanácshoz

Nagy-Britannia is meghívást kapott a Béketanácsba, amelynek létrehozását Donald Trump amerikai elnök kezdeményezte, de a brit kormány egyelőre nem csatlakozik a formálódó szerveződéshez - közölte csütörtökön Yvette Cooper brit külügyminiszter.
2026. 01. 22. 17:00
Megosztás:

Új korszak az európai pénzmosás és terrorizmus-finanszírozás elleni harcban

Az Európai Unió új pénzmosás-ellenes rendelete, az Anti-Money Laundering Regulation (AMLR), alapjaiban alakítja át a pénzügyi szektor megfelelési környezetét. A cél, hogy a tagállamokban egységes, adatalapú és kockázati szemléletű rendszer jöjjön létre a pénzügyi bűncselekmények megelőzésére. A következő években több mint 100 határidő és megfelelési mérföldkő vár az érintett pénzügyi szervezetekre. A Deloitte szakértői szerint a legfontosabb feladat most az, hogy a cégek időben felkészüljenek az új követelményekre, kialakítsák a szükséges belső folyamatokat és technológiai hátteret, valamint biztosítsák a munkatársak képzését.
2026. 01. 22. 16:30
Megosztás: