Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Több mint 120 millió forint adomány gyűlt össze palackvisszaváltásokból

Több mint 120 millió forint adomány gyűlt össze rászoruló családoknak a palackvisszaváltásokból fél év alatt – közölte a MOHU MOL Hulladékgazdálkodási Zrt. pénteken.
2026. 01. 17. 09:00
Megosztás:

Jól működött a katasztrófavédelem és a rendőrség rendszere az elmúlt hetekben

Az elmúlt hetekben bebizonyosodott, hogy működött a katasztrófavédelem és a rendőrség rendszere, a magyar emberek biztonságban érezhették magukat - mondta a Belügyminisztérium parlamenti államtitkára pénteken Budapesten.
2026. 01. 17. 08:00
Megosztás:

Üzleti központot létesít Kijevben a brit hadiipari cégeknek a brit kormány

Üzleti központot létesít Kijevben a brit hadiipari cégeknek a brit kormány az idén.
2026. 01. 17. 07:00
Megosztás:

Donald Trump: az Egyesült Államok nemzetbiztonsági rendszerében óriási lyukat jelentene, ha nem rendelkezne Grönlanddal

Az Egyesült Államok nemzetbiztonsági rendszerében óriási lyukat jelentene, ha nem rendelkezne Grönlanddal - jelentette ki Donald Trump amerikai elnök pénteken.
2026. 01. 17. 06:00
Megosztás:

Januárban érdemes könyvelőt váltani a pénzügyi stabilitásért

A januári könyvelőváltás nem technikai kérdés! Ez az az időpont, amikor tiszta alapokra helyezhető a cég teljes, éves pénzügyi stratégiája. A magyar vállalatvezetők jelentős része ugyanakkor érzelmi okokból vagy a folyamatok bonyolultságától tartva halogatja a lépést, miközben a cég növekedése már régen túlmutat az aktuális adminisztrációs kereteken.
2026. 01. 17. 04:00
Megosztás:

A nyugdíj összege a minimálbértől is függ, de miért kell ezt tudni?

A kötelező legkisebb munkabér, vagyis a minimálbér összege számos ponton befolyásolja a társadalombiztosítási ellátásokat. Az alábbiakban bemutatjuk, milyen összefüggések érvényesülnek a nyugdíj esetében, és hogy miért érdemes ezt tudni.
2026. 01. 17. 02:00
Megosztás:

Itt a jogszabály! Kerítésadó, minden méter kerítés után

Egy 2015-ben hatályba lépett jogszabály megteremtette annak a lehetőségét, hogy az önkormányzatok saját hatáskörben, helyi sajátosságokra szabott települési adókat vessenek ki olyan adótárgyakra, amelyekre nem vonatkozik központi adó, és amelyek adóztatását jogszabály kifejezetten nem tiltja.
2026. 01. 17. 01:00
Megosztás:

Top 10 legjobb No-KYC kriptotőzsde 2026-ban – Teljes rangsor és iparági elemzés

2026-ra soha nem látott mértékben nőtt a kereslet az anonim, személyazonosítást nem igénylő (No-KYC) kriptotőzsdék iránt. A felhasználók világszerte egyre inkább előnyben részesítik az olyan platformokat, ahol nem kell átadniuk személyes adataikat, és ahol gyorsan, hatékonyan, decentralizált módon tudnak kriptóval kereskedni vagy eszközöket váltani.
2026. 01. 16. 23:59
Megosztás:

Lemaradtál az Ethereum-ról és a Ripple-ről? A Digitap forradalmi online banki küldetése lehet a következő 10-szeres áttörés kulcsa

Bár az ETH és a Ripple árfolyama az elmúlt hetekben emelkedett, sok kereskedő lemaradt erről a mozgásról. Azok, akik így jártak, most más, erős növekedési potenciállal bíró altcoinokat keresnek.
2026. 01. 16. 23:00
Megosztás:

Változik az árazás az EDRI töltőhálózatán: érkezik az éjszakai kedvezményes tarifa

Új tarifastruktúrát vezet be országszerte az E.ON Drive Infrastructure Hungary (EDRI) az általa üzemeltetett több mint 240 nyilvános töltőberendezésen 2026. január 17-től. A változás célja, hogy a töltési díjak még jobban illeszkedjenek a felhasználók eltérő szokásaihoz és élethelyzeteihez, mindezt úgy, hogy az EDRI továbbra is kiszámítható, átlátható és országosan egységes árazást biztosít a helyszíni töltések esetében.
2026. 01. 16. 22:00
Megosztás:

Digitap ($TAP) vs $1.82 SUI vs $14.35 AVAX - Melyik a legjobb kriptó vétel 2026-ban?

A 2026-ra előretekintő befektetők egyre gyakrabban hasonlítják össze a korai fázisban lévő, hasznossággal bíró projekteket a már bejáratott Layer-1 (L1) hálózatokkal. Az olyan tokenek, mint a SUI és az AVAX mérettel rendelkeznek ugyan, de mindkettő értéke ~60%-kal esett vissza az év során, ami aggodalomra ad okot a befektetők körében. Ezzel párhuzamosan egyre nagyobb figyelem irányul az olyan kriptovaluta előértékesítésekre, amelyek valós piaci funkciókat kínálnak – különösen a bankszektorban.
2026. 01. 16. 21:00
Megosztás:

Jó hangulat, újabb történelmi csúcs a tőzsdén

A Budapesti Értéktőzsde részvényindexe, a BUX 1631,31 pontos, 1,35 százalékos emelkedéssel, 122 311,20 pontos új történelmi csúcson zárt pénteken.
2026. 01. 16. 20:00
Megosztás:

Újabb egészségfejlesztési program indult Hódmezővásárhelyen és Szatmárnémetiben

Európai uniós támogatással újabb egészségfejlesztési program indult Hódmezővásárhelyen és Szatmárnémetiben, a kezdeményezés célja a tervezett gyermekvállalás támogatása mellett a szűrési programok kiterjesztése - közölte Kallai Árpád, a Hódmezővásárhelyi és Makói Egészségügyi Ellátó Központ (HMEEK) főigazgatója pénteken.
2026. 01. 16. 19:30
Megosztás:

Rekordot döntött az európai uniós vendégéjszakák száma 2025-ben

Rekordszintre emelkedett az Európai Unióban a turisztikai szálláshelyeken eltöltött vendégéjszakák száma 2025-ben; az előzetes becslések szerint 3,08 milliárd vendégéjszakát regisztráltak, ami 61,5 millióval, azaz két százalékkal haladta meg az egy évvel korábbit - közölte az Európai Unió statisztikai hivatala, az Eurostat pénteken.
2026. 01. 16. 19:00
Megosztás:

Az iráni helyzetről egyeztetett Putyin és Netanjáhú

Az iráni helyzetről egyeztetett telefonon Vlagyimir Putyin orosz elnök és Benjámín Netanjáhú izraeli miniszterelnök - közölte a Kreml sajtószolgálata pénteken.
2026. 01. 16. 18:00
Megosztás:

A siker pszichológiája: mit tanítanak a sorozatok a döntésekről és az esélyekről

A sikersorozatok mentális feldolgozása alapvetően meghatározza a jövőbeli stratégiai lépések minőségét minden kompetitív területen. Az emberi agy biológiailag hajlamos mintákat keresni ott, ahol valójában csak véletlenszerű események láncolata látható a valóságban.
2026. 01. 16. 17:30
Megosztás:

Együttműködési megállapodást kötött a HungaroControl és az Óbudai Egyetem

Új lendületet ad a légi közlekedés technológiai fejlesztésének és a műszaki felsőoktatás modernizációjának a HungaroControl Magyar Légiforgalmi Szolgálat Zrt. és az Óbudai Egyetem új együttműködése – közölte az intézmény pénteken az MTI-vel.
2026. 01. 16. 17:00
Megosztás:

6 órás leállás a Sui blokkláncon – Konszenzushiba bénította meg a hálózatot

Január 15-én a Sui blokklánc felhasználói drámai pillanatokat éltek át: a hálózat hat órára teljesen leállt, ami komoly aggodalmat váltott ki a kriptoközösségben. A Sui csapata azóta közzétette a hivatalos jelentést az incidensről, amelyből kiderült: egy konszenzusfeldolgozási hiba bénította meg a rendszer működését.
2026. 01. 16. 16:30
Megosztás:

A tőzsde ma már nem kiváltság, hanem versenyelőny

Egyre több hazai középvállalat lát lehetőséget a tőzsdei jelenlétben – derül ki a Duna Capital összefoglalójából. A tőzsdére lépés nemcsak alternatívát jelent a dráguló bankhitelekkel és a kockázati tőkével szemben, hanem új növekedési irányokat is megnyithat. Karaszi Csaba, a társaság ügyvezetője szerint a tőzsdei forrás nem hitel, hanem a cég tőkehelyzetét erősítő megoldás, amely javítja a hitelfelvételi lehetőségeket, és lehetővé teszi, hogy a részvény felvásárlásoknál fizetőeszközzé váljon.
2026. 01. 16. 16:00
Megosztás:

Javult a MÁV pontossága tavaly decemberben

Sok érdekesség olvasható ki 2025 utolsó hónapjának menetrendszerűségi statisztikájából, de a lényeg: bár az ünnepi időszak közlekedési csúcsszezonnak számít nálunk, a pontosságunk nem romlott, hanem még érdemben javult is - közölte a MÁV-csoport vezérigazgatója pénteken a Facebook oldalán.
2026. 01. 16. 15:30
Megosztás: