Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Olcsóbb beszállók a kriptóban: 95 millió dollárt vontak be startupok a piaci visszaesés közepén

A 2 ezermilliárd dolláros kriptopiaci korrekció nemcsak fájdalmat, hanem lehetőséget is hozott a befektetők számára. A kockázati tőkebefektetők (venture capital, VC) egyre kedvezőbb feltételekkel szállnak be projektekbe, miközben a mesterséges intelligencia (AI) és a predikciós piacok vezetik a friss tőkebevonási hullámot. A héten három startup összesen 95 millió dollárt gyűjtött össze – a háttérben pedig egyre tudatosabb, fundamentumvezérelt befektetői szemlélet rajzolódik ki.
2026. 02. 21. 12:00
Megosztás:

A klíma már nem luxus Magyarországon – a kereslet robbanása új szereplőt hoz a piacra

2026-ra a légkondicionálók jelenléte a magyar otthonokban robbanásszerűen megnövekedett. 2022-ben még 4,6 millió lakásból körülbelül 1,2 millió otthonban volt klíma; 2024-re ez az arány 26 százalékról már 33 százalékra nőtt. A trend azóta is folytatódik: a tartós nyári hőségek, az őszi-téli fűtéskiegészítés iránti igény, a gyerekszobák hűtése, az idősebb, illetve érzékenyebb családtagok kényelme, valamint az otthoni munkavégzés elterjedése mind alapvető igénnyé tették a légkondicionálót.
2026. 02. 21. 11:00
Megosztás:

A bitcoin bányászati költségei jelzik a piaci aljat? Fontos fordulat körvonalazódik

A Bitcoin árfolyama jelenleg az átlagos kitermelési költség alatt mozog, ami történelmileg ritka és figyelemre méltó jelenség. A bányászati profitabilitás szűkülése, a nagy befektetők ismételt felhalmozása és a rekordkereskedési volumenek együtt olyan piaci környezetet teremtenek, amely akár egy ciklikus mélypont előszelét is jelezheti.
2026. 02. 21. 10:00
Megosztás:

Ki ülhet a céges autó volánja mögé?

A céges autók kezelése sok vállalat számára lényeges kérdés, hiszen ez nem csupán kényelmi, hanem jogi, biztosítási és működési szempontokból is fontos. Az alapvető kérdés: ki jogosult vezetni ezeket az autókat, és milyen feltételek mellett? Annak érdekében, hogy a céged gördülékenyen, jogszerűen és biztonságosan működjön, érdemes átgondolni a témát.
2026. 02. 21. 09:00
Megosztás:

Hivatalosan megkezdődött a kampányidőszak

Hivatalosan megkezdődött szombaton az április 12-ei országgyűlési képviselő-választás kampányidőszaka, életbe léptek a kampányra vonatkozó szabályok.
2026. 02. 21. 08:00
Megosztás:

A BioTechUSA és a Docler Holding vezérei új vállalkozást indítottak

Közös globális brand építésébe kezd a hazai IT- és étrendkiegészítő piac két meghatározó üzleti vezetője a digitális identitás és tartalomhitelesítés területén komplex szolgáltatást nyújtó Netlocknál.
2026. 02. 21. 07:00
Megosztás:

Itt az utolsó esélyünk a GMO-k kontrollálására

Legkorábban már március elején elfogadhatja az Európai Parlament azt a rendelet-tervezetet, ami lényegében megszünteti a hatósági kontrollt és nyomon követést az új géntechnológiával készült, génmódosított termékek (új GMO-k) felett. Aki ezzel nem ért egyet ‒ legyen szó szervezetről vagy magánszemélyről ‒ még van lehetősége jelezni ezt a magyar európai parlamenti képviselők felé, akik csak akkor tudnak hatékonyan fellépni a tervezet jelen formája ellen, ha megvan hozzá a megfelelő társadalmi támogatottságuk.
2026. 02. 21. 06:00
Megosztás:

Kátyúvadászat helyett biztonság – így vezessünk sérülés nélkül

Kellemetlen meglepetést hagyott hátra az új év elején jött hirtelen lehűlés. A télies időjárás során látványosan megszaporodtak a kátyúk az utakon, ezzel tovább nehezítve a közlekedést. De tudják-e a sofőrök, mi a teendő, ha találkoznak egy olyan úthibával, ami esetleg kárt tehet az autóban vagy akár saját testi épségükben? Arra, hogy hogyan kerülhetők el a kátyúk okozta balesetek, illetve probléma esetén miként érdemes biztonságosan eljárni, a Hankook és Kőrös András, a Hungaroring Driving Center vezetéstechnikai szakembere hívja fel a figyelmet.
2026. 02. 21. 05:00
Megosztás:

Mennyi személyi kölcsönt lehet felvenni az átlagbérből?

A Központi Statisztikai Hivatal (KSH) friss jelentése szerint 2025 decemberében bruttó 789 200, illetve nettó 548 900 forint volt a teljes munkaidőben alkalmazásban állók átlagkeresete. Ez a bruttó átlagkereset esetében 8,5%, a nettó esetében 9,8%, a reálkereset esetében pedig 6,3% emelkedést jelent az egy évvel korábbihoz képest. A bruttó kereset mediánértéke 607 700, a nettó kereset mediánértéke 427 500 forint volt decemberben, amely értékek 9,4, illetve 10,8%-kal voltak magasabbak az előző év azonos időszakánál. A Bank360 számításai szerint ekkora átlagbérből már a legmagasabb, 15 millió forintos személyi hitelek is felvehetők, de a nettó mediánbér esetében is 13-14 millió forint körül található a felvehető hitelösszeg felső határa.
2026. 02. 21. 04:00
Megosztás:

Előrejelzéseket meghaladó eredmények 2025-ben az Accornál

Az Egyesült Államok Legfelsőbb Bírósága érvénytelenítette a Donald Trump elnök által bevezetett, országonként megállapított vámokat pénteken.
2026. 02. 21. 03:00
Megosztás:

Nyugdíj törvényi rendelet - a nyugdíjba vonulás időpontja dönti el a nyugdíj összegét

A nyugdíjba vonulás időpontjának megválasztása nemcsak élethelyzet kérdése, hanem komoly anyagi döntés is. Nem mindegy ugyanis, hogy valaki melyik évben kéri a nyugdíját, mert ez hatással lehet az induló összegre, az emelésekre és a plusz juttatásokra is.
2026. 02. 21. 02:00
Megosztás:

Figyelem, idő és döntések az Alawin Casino Online korszakában

A digitális gazdaság egyik legfontosabb – és legnehezebben mérhető – erőforrása ma már nem pusztán a tőke vagy a munkaerő, hanem a figyelem. Platformok, alkalmazások és online szolgáltatások sora versenyez azért, hogy a felhasználók idejéből részesedést szerezzen. Ez a folyamat nemcsak a médiapiacot formálta át, hanem a fogyasztói döntések logikáját is: mikor, mire és milyen intenzitással fordítunk időt egy adott tevékenységre.
2026. 02. 21. 01:30
Megosztás:

Feladtad már az eheti 5-ös lottót? Meg fogsz lepődni, ha ezt megtudod

Az Ötöslottó történetében a hatodik legnagyobb főnyeremény vár gazdára most szombaton. A csaknem 5 milliárd forintos összeg a győztes és családja számára hosszú távon is fényűző életet tehet lehetővé.
2026. 02. 21. 01:00
Megosztás:

Donald Trump döntéseit érvénytelenítette a bíróság

Az Egyesült Államok Legfelsőbb Bírósága érvénytelenítette a Donald Trump elnök által bevezetett, országonként megállapított vámokat pénteken.
2026. 02. 21. 00:05
Megosztás:

Lengyelországi logisztikai központtal bővíti portfólióját az Appeninn

Az Appeninn Vagyonkezelő Holding Nyrt. a társaság 100 százalékos tulajdonában álló lengyel leányvállalatán keresztül megvásárolta a lengyelországi Tarnówban található Goodyear logisztikai központot - közölte az ingatlanbefektetési társaság pénteken az MTI-vel .
2026. 02. 20. 23:00
Megosztás:

Az Aston Martin közel 10 százalékkal kevesebb autót adott el tavaly

Az Aston Martin Lagonda Global Holdings brit sportautó-gyártó arról jelentett pénteken, hogy tavaly 5448 járművet értékesített, közel 10 százalékkal kevesebbet a 2024. évi 6030 után.
2026. 02. 20. 22:00
Megosztás:

Tervpályázatot írtak ki a hévízi tófürdő és kórház fejlesztésére

Tervpályázatot írtak Tervpályázatot írtak ki a hévízi gyógyfürdő és kórház komplex fejlesztésére, a pályázók július végéig küldhetik be elképzeléseiket a három nagyobb ütemet jelentő feladatról.
2026. 02. 20. 21:00
Megosztás:

Ukrán elnök: a következő ukrán-orosz-amerikai tárgyalás már valóban eredményes lehet

Reményét fejezte ki Volodimir Zelenszkij ukrán elnök pénteken arra, hogy a háromoldalú, ukrán-orosz-amerikai tárgyalások következő fordulója februárban megvalósul, és véleménye szerint ez lehet az, amely valóban eredményes lesz.
2026. 02. 20. 20:00
Megosztás:

Állásbörzét rendez a Vulcan Shield Global Békéscsabán

Először rendez állásbörzét jövő szombaton a 280 milliárd forintos beruházással 2500 új munkahelyet teremtő Vulcan Shield Global (VSG) Békéscsabán. Megkezdődtek a kivitelezési munkálatok is a leendő gyár helyszínéül szolgáló iparterületen.
2026. 02. 20. 19:00
Megosztás:

Az építési engedélyek megugrása már az élénkülés előjele

A Mapei Kft. értékelése szerint a friss adatok az egyértelmű fordulópontot jelzik a lakáspiacon. Az átadott lakások száma még a korábbi, gyengébb időszak beruházási döntéseit tükrözi, míg az engedélyszám ugrásszerű növekedése már az új ciklus kezdetét mutatja.
2026. 02. 20. 18:30
Megosztás: