Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Országos energetikai csapatversenyt hirdet diákoknak az OPUS Energetika Csoport

Idén már negyedik alkalommal hirdet országos energetikai és fenntarthatósági csapatversenyt középiskolás diákok számára az OPUS Energetika Csoport - közölte a társaság szerdán az MTI-vel.
2026. 01. 15. 03:30
Megosztás:

Több mint százéves Bugatti és 1050 lóerős villanyautó - 2025-ös rekordok a használtautó-piacról

Mozgalmas évet zárt a hazai használtautó-piac 2025-ben: a Használtautó.hu-n személyautók iránt közel 5 millió érdeklődés érkezett, miközben a felhasználók több mint 1,2 millió hirdetést adtak fel az év során. Az átlagos kínálati ár 5,1 millió forint körül alakult, az autók átlagéletkora megközelítette a 13 évet, az átlagos futásteljesítmény pedig 178 ezer kilométer volt. A számokból azonban nemcsak trendek, hanem kifejezetten meglepő rekordok is kirajzolódtak.
2026. 01. 15. 03:00
Megosztás:

Átfogó felújítási munkák zajlanak a Gödöllői Semmelweis Egészségközpontban

Előre tervezett, átfogó felújítási munkák zajlanak a Gödöllői Semmelweis Egészségközpontban, amelyek első üteme előreláthatóan február végén fejeződik be. Annak érdekében, hogy ez idő alatt a térség lakóinak ne kelljen a fővárosba utazniuk az ambuláns ellátásért, az egyetem úgy szervezte a munkálatokat, hogy a betegellátás folyamatosan, zavartalanul működjön - közölte a Semmelweis Egyetem az MTI-vel szerdán.
2026. 01. 15. 02:30
Megosztás:

Miért kritikus a HFR és tűzjelző rendszerek felülvizsgálata 2026-ban?

A 2025-ös hazai tűzeseti adatok ismét rávilágítanak arra, hogy alapvetően maga a füst, nem pedig a lángok, a tűzesetek legnagyobb veszélyforrása. A katasztrófavédelem 2025-ös jelentése szerint például, az év első kilenc hónapjában, 4739 lakóépület gyulladt ki, melyek során, 77 ember életét vesztette, 473 pedig megsérült – és ezekben az esetekben, a füst gyors elterjedése gyakran nehezítette a menekülést és a mentést. Ráadásul az érintett lakóépületek közül, mindössze néhányban volt csak tűzjelző rendszer vagy valamilyen füstérzékelő eszköz, ami a korai jelzések hatékonyságát még inkább kérdésessé teszi.
2026. 01. 15. 02:00
Megosztás:

Megduplázta nettó nyereségét a cseh mezőgazdaság

Megduplázta nettó nyereségét a cseh mezőgazdaság tavaly - közölte a cseh mezőgazdasági szövetség elnöke Prágában, sajtótájékoztatón.
2026. 01. 15. 01:30
Megosztás:

Nagy változások az özvegyi nyugdíjnál 2026-ban

A Magyarország 2026. évi költségvetésének megalapozásáról szóló 2025. évi LI. törvény módosította az 1997. évi LXXXI. törvényt, amely több ponton megváltoztatta az özvegyi nyugdíjra vonatkozó szabályokat.
2026. 01. 15. 01:00
Megosztás:

A One Macedonia, a 4iG Csoport leányvállalata 5G frekvenciapályázatot nyert Észak-Macedóniában

A One Macedonia, a 4iG Csoport telekommunikációs leányvállalata nyert Észak-Macedónia országos 5G frekvenciapályázatán, így lehetőséget kap arra, hogy létrehozza az ország első, teljes lefedettségű, önálló (5G SA) hálózatának alapjait. A beruházás keretében a régió egyik legfejlettebb és legbiztonságosabb „5G standalone” hálózata valósulhat meg az Ericssonnal kialakított stratégiai együttműködésre építve, összhangban az európai szabványokkal és értékekkel.
2026. 01. 15. 00:30
Megosztás:

Megállapodást irt alá az Unicredit és az Európai Beruházási Alap

Az UniCredit és az Európai Beruházási Alap (EIF) új InvestEU-garanciamegállapodást írt alá, ezzel közel 890 millió eurónyi finanszírozás válhat elérhetővé a kis- és középvállalkozások számára a régióban, beleértve Magyarországot is 2027 végéig - közölte az UniCredit az MTI-nek küldött szerdai közleményében.
2026. 01. 14. 23:30
Megosztás:

A Versenyképes Járások Program segít élhetőbbé tenni a magyar vidéket

A Versenyképes Járások Program segít élhetőbbé tenni a vidéki kistelepüléseket - jelentette ki a Közigazgatási és Területfejlesztési Minisztérium területfejlesztésért felelős államtitkára szerdán a program támogatásával beszerzett eszközök és aszfaltburkolattal ellátott út átadásán Vámosgyörkön és Atkáron.
2026. 01. 14. 23:00
Megosztás:

ANYÁCSKA néven új nyomtatványt hozott létre a NAV

Azoknak az anyáknak, akik egyidejűleg több kedvezményre is jogosultak, a Nemzeti Adó- és Vámhivatal (NAV) létrehozta az ANYÁCSKA elnevezésű nyomtatványt - jelentette be a kultúráért és innovációért felelős miniszter a Facebookon szerdán.
2026. 01. 14. 22:30
Megosztás:

A 900 milliárd dolláros hazautalási piac megcélzása teszi ezt a januári időszak legjobb kriptoelőértékesítésévé

A hasznosságot kínáló (utility) tokenek jelenleg óriási népszerűségnek örvendenek a kriptovilágban. Mivel az intézményi érdeklődés csökken, a piaci likviditás pedig alacsony, a befektetők egyre inkább azokra a tokenekre összpontosítanak, amelyek folyamatos bevételi forrással és nagy növekedési potenciállal bíró célpiaccal rendelkeznek.
2026. 01. 14. 22:00
Megosztás:

Kinevezte az ukrán parlament az új védelmi minisztert

Mihajlo Fedorovot nevezte ki új védelmi miniszternek szerdán az ukrán parlament Denisz Smihal helyett, aki új tisztségeket kapott.
2026. 01. 14. 21:30
Megosztás:

Két tényező fékezte az eladók Otthon Start miatti túlárazását az ingatlanpiacon

A túlárazottság mértéke, és vevői részről a túlárazott ingatlanokhoz való viszony az Otthon Start tavalyi bejelentését követően jelentős mértékben megváltozott. A támogatott hitel miatt könnyebben elfogadták a túlárazásokat a vevők, mint korábban, de nem mindenhol, ráadásul voltak korlátai is.
2026. 01. 14. 21:00
Megosztás:

Ez a 4 kriptovaluta túlteljesíti az Ethereumot 2026-ban

Az Ethereum jelenleg egy döntési zónában helyezkedik el. Az árfolyam kulcsfontosságú támasz- és ellenállási szintek között mozog. A forgalom gyenge. A kereskedők egyértelmű kitörésre vagy letörésre várnak. Ez a konszolidáció másutt teremt lehetőséget.
2026. 01. 14. 20:00
Megosztás:

Történelmi csúcson zárt a BUX és az OTP is

A Budapesti Értéktőzsde részvényindexe, a BUX 1788,47 pontos, 1,5 százalékos emelkedéssel 120 651,59 ponton, történelmi csúcson zárt szerdán.
2026. 01. 14. 19:30
Megosztás:

Gyengült szerdán a forint

Gyengült szerdán a forint a főbb devizákkal szemben a kora reggeli jegyzéséhez képest a bankközi piacon. A forint gyengébben áll heti és a havi kezdéséhez képest is.
2026. 01. 14. 19:00
Megosztás:

Sokan bukhatják az új energiatárolós támogatást, de vannak, akik duplán nyernek!

Várhatóan február 1-jén megnyílik a 100 milliárd forintos keretösszegű energiatároló pályázat, amely a szakértők szerint tökéletes mentőöv a bruttó elszámolásba kényszerülő családoknak. Miközben a 2,5 milliós vissza nem térítendő támogatás rendkívül vonzó, a műszaki tartalom hibás kiválasztása miatt tízezrek eshetnek el a program valódi előnyeitől.
2026. 01. 14. 18:30
Megosztás:

Az EU beterjesztette a 90 milliárd eurós közös hitelfelvételt

Brüsszel beterjesztette a 90 milliárd eurós közös hitelfelvételt Ukrajna és a háború finanszírozására. Az Európai Bizottság jogalkotási javaslatcsomagot fogadott el annak érdekében, hogy 2026-2027-ben is biztosított legyen Ukrajna folyamatos pénzügyi támogatása - közölte szerdán a brüsszeli testület.
2026. 01. 14. 18:00
Megosztás:

Csökkent tavaly az Audi globális kiszállítása

Az Audi több mint 1,6 millió járművet szállított ki ügyfeleinek világszerte tavaly, ami 2,9 százalékos csökkenést jelent az előző évhez képest. A kiszállítások azonban szeptembertől kezdődően minden hónapban emelkedtek éves összevetésben - áll a cég honlapjára fölkerült közleményben.
2026. 01. 14. 17:30
Megosztás:

Újabb segítség a kukoricatermelőknek

Nyilvánosak a Gabonatermesztők Országos Szövetsége (GOSZ), a Vetőmag Szövetség Szakmaközi Szervezet és Terméktanács (VSZT), valamint a Nemzeti Agrárgazdasági Kamara (NAK) posztregisztrációs fajtakísérleteinek legújabb eredményei, amelyek objektív információkkal, adatokkal segítik a gazdálkodókat - tájékoztatott a három szervezet közös közleményben, amelyet szerdán juttattak el az MTI-hez.
2026. 01. 14. 17:00
Megosztás: