Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Vitalik Buterin: Zsákutca a klónblokklánc – az Ethereum ökoszisztémának valódi innovációra van szüksége

Vitalik Buterin ismét egyértelmű üzenetet küldött az Ethereum-fejlesztőknek: az „copy-paste” EVM-láncok és a felszínes layer-2 kapcsolatok hosszú távon az ökoszisztéma stagnálásához vezetnek. Szerinte a kényelemre optimalizált megoldások helyett valódi, új képességeket hozó innovációkra van szükség.
2026. 02. 05. 16:00
Megosztás:

Januárban 1,6 százalékos volt az éves infláció Csehországban

Januárban 1,6 százalékkal nőttek a fogyasztói árak Csehországban az egy évvel korábbiakhoz viszonyítva - közölte a Cseh Statisztikai Hivatal (CSÚ) csütörtökön Prágában.
2026. 02. 05. 15:30
Megosztás:

Változás a vezetésben: előtérben a bizalom - A munkahelyi működés új mozgatórugói

Új megvilágításba helyezték az elmúlt évek tapasztalatai a vezetők szerepét és a munkahelyi működés alapjait. A Leading with trust című tanulmányból is kiderült, hogy a bizalom tudatos építése ma már nem csupán értékválasztás, hanem a hatékony együttműködés és a fenntartható teljesítmény egyik legfontosabb alapja. A kutatás olyan, eddig kevésbé látható működési mechanizmusokra is rávilágít, amelyek jelentősen befolyásolják, hogyan érzik magukat az emberek a munkahelyükön, és hogyan születnek meg a mindennapi döntések.
2026. 02. 05. 15:00
Megosztás:

A forint és a cseh korona erősödött az euróval és a dollárral szemben

Azok a vállalatok, amelyek rendelkeztek devizastratégiával, már 2026 januárjában javíthatták eredményeiket – különösen az importőrök. A fedezet hiánya alacsonyabb árrést jelentett az exportőrök számára.
2026. 02. 05. 14:30
Megosztás:

BKV: a buszok csaknem tíz százalékát korszerű járművekre cserélték

Autóbuszai csaknem tíz százalékát korszerű járművekre cserélte a BKV: csütörtöktől mind a 65, teljesen alacsonypadlós, korszerű kényelmi és biztonsági felszereltségű Mercedes Benz Citaro K jármű forgalomba állt a fővárosban - közölte a társaság az MTI-vel.
2026. 02. 05. 13:30
Megosztás:

A vártnál erőteljesebben nőtt az Alphabet negyedéves nyeresége és bevétele

A Google anyavállalata, az Alphabet jelentős nyereség- és árbevétel-növekedést ért el a tavalyi utolsó negyedévben, mindkét adat meghaladta az elemzői várakozásokat.
2026. 02. 05. 13:00
Megosztás:

Ismét hangos reklámok miatt járt el a médiatanács

A Nemzeti Média- és Hírközlési Hatóság (NMHH) Médiatanácsa az előző héthez hasonlóan a reklámok hangereje miatt szankcionált egy médiaszolgáltatót. A testület gyermekmesék korhatár-besorolásának megfelelőségéről is döntött - közölte a hatóság kommunikációs igazgatósága csütörtökön az MTI-vel.
2026. 02. 05. 12:30
Megosztás:

Megtévesztő gyógyhatást ígérő termékek a fókuszban - fogyasztóvédelmi ellenőrzés indul

A Nemzeti Kereskedelmi és Fogyasztóvédelmi Hatóság (NKFH) a szakmai irányítása alatt álló kormányhivatalokkal együttműködve átfogó vizsgálatot indított a sérülékeny fogyasztói csoportokat célzó tisztességtelen kereskedelmi gyakorlatok megakadályozása érdekében. Az ellenőrzések érintik a gyermekek védelme mellett az idősek számára szóló, egészségügyi szolgáltatásnak álcázott kezeléseket, valamint a fogyatékkal élő és sajátos nevelési igényű gyermeket gondozó családokat megszólító, sok esetben nem valós állításokat alkalmazó termékeket is.
2026. 02. 05. 12:00
Megosztás:

Adómentes lett az üzleti ebéd - 2026 januártól, visszamenőlegesen, ha étteremben költöttük azt el

100 millió forintig adómentes a reprezentáció: mostantól nemcsak üzleti döntés, hanem pénzügyi előny is étteremben találkozni az ügyfelekkel: a friss kormányrendelet jelentős adóterhet vesz le a vállalkozások válláról, miközben élénkíti a vendéglátást.
2026. 02. 05. 11:30
Megosztás:

Ez a 10 legkeresettebb használt autó most Magyarországon 6000 km alatt

A Használtautó.hu adatai alapján 2026 januárjában látványos átrendeződés indult el a 6000 kilométernél kevesebbet futott, 2024–2026-os évjáratú autók piacán. Ezek a járművek a hatályos áfaszabályozás szerint is technikailag új autónak minősülhetnek, hiszen vagy még nem kerültek forgalomba, vagy futásteljesítményük nem haladja meg a 6000 kilométert, illetve a regisztrációjuk óta kevesebb mint hat hónap telt el. Míg 2025-ben még döntően a hosszú évek óta ismert gyártók határozták meg a kínálatot, 2026 elején több, a magyar piacon nemrég megjelent kínai márka is előkelő helyre került.
2026. 02. 05. 11:00
Megosztás:

Thaiföld egyik legelismertebb egyetemével kötött együttműködési megállapodást a Miskolci Egyetem

A Miskolci Egyetem együttműködési szándéknyilatkozatot írt alá Thaiföld egyik vezető felsőoktatási intézményével, a University of Thai Chamber of Commerce-szel Bangkokban, Szijjártó Péter külgazdasági és külügyminiszter jelenlétében.
2026. 02. 05. 10:30
Megosztás:

Romániában a költségvetési korrekciók után gazdaságélénkítő intézkedések következnek

Romániában a deficitcsökkentést célzó költségvetési korrekciók után a kormány gazdaságélénkítő intézkedések bevezetését tervezi - jelentette be Ilie Bolojan miniszterelnök szerdán.
2026. 02. 05. 10:00
Megosztás:

Hamis aranylapokkal bukott le egy győri banda

Hamis aranylapokkal bukott le egy győri banda; 216 millió forintnyi lehet a kár - közölte a Rendészeti Államtitkárság csütörtökön a Facebook-oldalán.
2026. 02. 05. 09:30
Megosztás:

AMD: a növekedési sztori él, de a piac többet várt

Az AMD a tegnapi zárás után publikálta negyedéves eredményeit. A chipgyártó részvényeinek idei felülteljesítése után a befektetők magasra tették a lécet, amelyet csak részben sikerült megugrani. A lezárt negyedév eredményei minden téren felülmúlták a várakozásokat, azonban a kínai értékesítések kilátásaival kapcsolatos bizonytalanságok továbbra is nyomást gyakorolhatnak a megítélésre. A menedzsment bevételi és eredményvárakozásai ugyan a konszenzust meghaladták, ám nem érték el a piac optimistább forgatókönyveit. Ennek következtében, a kedvező eredményszámok ellenére, a befektetők reakciója visszafogottnak bizonyult, és a vállalat részvényei mintegy 7%-ot estek a zárás utáni kereskedésben.
2026. 02. 05. 09:00
Megosztás:

Hány forint most egy euró? Meg fogsz lepődni!

Vegyesen mozgott a forint a főbb devizákkal szemben csütörtök reggel az előző esti jegyzéséhez képest a nemzetközi devizakereskedelemben.l.
2026. 02. 05. 08:30
Megosztás:

Erősíti kapcsolatát a Magyar Posta és a Temu

Szándéknyilatkozatot írt alá a Magyar Posta és a Temu online piactér üzleti kapcsolataik erősítésére és a közös fejlesztési lehetőségek feltérképezésére, a két társaság célja a Temun keresztül értékesítést végző magyar e-kereskedők, valamint a magyar lakosság magasabb szintű kiszolgálása - közölte a Magyar Posta az MTI-vel szerdán.
2026. 02. 05. 08:00
Megosztás:

Rádióadásokat indított az iráni lakosság tájékoztatására a BBC világszolgálata

Hagyományos hullámhosszokon fogható rádióadásokat indított az iráni lakosság tájékoztatására szerdán a BBC világszolgálata (BBC World Service), miután az elmúlt hetek kormányellenes tiltakozó megmozdulásai nyomán a teheráni rezsim leállította az internetszolgáltatást az országban.
2026. 02. 05. 07:30
Megosztás:

Január végén az Otthon Start programban folyósított hitelszerződések száma meghaladta a 22 ezret

Öt hónapos az Otthon Start program, amelyben január végével a folyósított hitelszerződések száma meghaladta a 22 ezret, és minden második hitelszerződést fiatal házaspárok kötötték - közölte a Miniszterelnökség parlamenti és stratégiai államtitkára szerdai szerencsi sajtótájékoztatóján.
2026. 02. 05. 07:00
Megosztás:

A Hyundai mintegy 265 ezer autó gyártását tervezi az idén csehországi gyárában

A dél-koreai Hyundai járműgyártó mintegy 265 ezer autó gyártását tervezi az idén csehországi gyárában, Nosovicében, a teljes gyártás hozzávetőlegesen 50 százalékát a villamosított modellek teszik ki - tájékoztatta a Hyundai Motor Manufacturing Czech (HMMC) közleményben az MTI-t szerdán, abból az alkalomból, hogy a gyárban elkészült az ötmilliomodik jármű.
2026. 02. 05. 06:30
Megosztás:

Horvátországban 187 ezer daganatos beteg él, ekkora a túlélési arány

Horvátországban 187 ezer olyan ember él, akinél élete során daganatos megbetegedést diagnosztizáltak. Az ötéves túlélési arány az elmúlt időszakban 54 százalékról 59 százalékra emelkedett - derült ki a Horvát Rákregiszter legfrissebb adataiból, amelyeket szerdán, a rák elleni küzdelem világnapja alkalmából mutattak be.
2026. 02. 05. 05:30
Megosztás: