Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Indul a peronépítés Keleti pályaudvaron, módosul a dunántúli távolsági vonalak közlekedési rendje

Hétfőn kezdődik az akadálymentes peron építése a Keleti pályaudvaron, ezért módosul a Keleti pályaudvart érintő dunántúli távolsági vonalak közlekedési rendje, több dunántúli vonat végállomása Kelenföldre kerül át - közölte a Mávinform szombaton az MTI-vel.
2026. 01. 11. 10:00
Megosztás:

Az új évben is ingyenesen segíti a nyelvtanulást a KRÉTA Idegennyelvi Felkészítő Modul

A KRÉTA Idegennyelvi Felkészítő Modul térítésmentesen elérhető platform nemcsak a diákoknak és a tanároknak, hanem a Kréta-azonosítóval rendelkező szülőknek is lehetőséget ad a fejlődésre, a tanulásra, a nyelvtudásuk felfrissítésére.
2026. 01. 11. 09:00
Megosztás:

Tetőzhetett a budapesti lakásár-növekedés

Miközben több vármegyében fokozódott a lakások és házak áremelkedése tavaly év végén, Budapesten, ha csak kicsit is, de mérséklődött a drágulás üteme - derül ki a zenga.hu ingatlankereső portál adataiból. Ennek ellenére a főváros legolcsóbb kerületei is vetekszenek a legdrágább vármegyeszékhelyek hirdetési négyzetméteráraival.
2026. 01. 11. 08:00
Megosztás:

Tovább zuhant decemberben a FAO élelmiszerár-indexe, hiába drágult a gabona

Az ENSZ Élelmezésügyi és Mezőgazdasági Szervezete (FAO) pénteken kiadta legfrissebb jelentését az élelmiszer-alapanyagok világpiaci mutatójáról, amely szerint decemberben tovább csökkentek az élelmiszerárak az előző hónaphoz képest, mivel a tejtermékek, a hús és a növényi olajok jegyzéseinek visszaesése ellensúlyozta a gabonafélék és a cukor árának emelkedését.
2026. 01. 11. 07:00
Megosztás:

Otthon Start: mit okozna, ha eltörölnék a támogatott lakáshitelt?

Az MNB lakáshitel statisztikái alapján 273,99 milliárd forint összegben kötöttek szerződést a magyarok novemberben. Ezen összegből 222,64 milliárd forint kapcsolódott valamilyen támogatott kölcsönhöz. Ez a teljes havi összeg 81,26 százaléka, mondhatni csak minden ötödik forintot helyeztek ki a bankok piaci alapon. De ez egy jó hír, vagy inkább probléma?
2026. 01. 11. 06:00
Megosztás:

Ukrán elnök: Kijev vizsgálja a Donyec-medencei gazdasági övezet létrehozására vonatkozó amerikai javaslatot

Ukrajna vizsgálja az Egyesült Államoknak azt a javaslatát, hogy szabad gazdasági övezet hozzanak létre a Donyec-medencében a háború lezárása után - jelentette ki Volodimir Zelenszkij ukrán elnök a Bloomberg hírügynökségnek adott nyilatkozatában, amelyet az UNIAN ukrán hírügynökség szemlézett szombaton.
2026. 01. 11. 05:00
Megosztás:

Melyik a legnépszerűbb használt autómárka most Magyarországon?

2025-ben a DataHouse adatai szerint 128 155 import használt személyautó került hazai forgalomba Magyarországon, ami 15,5 százalékkal haladta meg az egy évvel korábbi, 110 961-es értéket. Noha ezzel öt éve nem látott szintre emelkedett a használtautó-import, ez a volumen továbbra is jelentősen elmarad a Covid-járványt megelőző időszak évi 155-160 ezres szintjétől.
2026. 01. 11. 04:00
Megosztás:

Ezekkel a számokkal nyerhettél az ötös lottón!

A Szerencsejáték Zrt. tájékoztatása szerint a 2. héten megtartott ötös lottó és Joker számsorsoláson a következő számokat húzták ki:
2026. 01. 11. 03:00
Megosztás:

A rendeletet aláírták! 65-94 éves nyugdíjasok készüljetek!

2024-től a nyugdíjelőleget már nem határozatban, hanem végzésben állapítják meg. Felmerül a kérdés, hogy ez a formai változás milyen hatással lehet a nyugdíjasokra és magukra a nyugdíjakra. Érdemes részletesebben utánanézni a témának, mert sokak számára fontos következményekkel járhat ez a módosítás. Mit jelent ez pontosan egy nyugdíjas szemszögéből? Elmagyarázzuk cikkünkben.
2026. 01. 11. 02:00
Megosztás:

Földgázzal fűt? Így nem vész el a kedvezményes földgázmennyiség

Az éves szinten járó kedvezményes földgázmennyiség nem vész el, azt legkésőbb az éves elszámolószámlában minden ügyfél esetében elszámolja az MVM - közölte a társaság szombaton Facebook-bejegyzésében.
2026. 01. 11. 01:00
Megosztás:

Hófúvás miatt másodfokú riasztást adott ki a HungaroMet egyes északkeleti járásokra

Hófúvás veszélye miatt másodfokú (narancs) riasztást adott ki Szabolcs-Szatmár-Bereg és Borsod-Abaúj-Zemplén vármegye egyes járásaira a HungaroMet Nonprofit Zrt. szombat este.
2026. 01. 11. 00:05
Megosztás:

Digitap: Biztonságosabb választás, mint az ETH és a SOL? Banki szintű védelem 20-szoros növekedési potenciállal

Nemrég az Ethereum és a Solana árfolyama is ismét zöldbe fordult a 2025 negyedik negyedévi összeomlás után. Ennek ellenére sok kereskedő figyelme most inkább a Digitap ($TAP) felé fordul. Ez az előértékesítési fázisban lévő kripto-projekt jelenleg a harmadik körben jár, több mint 3,5 millió dollárt gyűjtött össze, miközben a korai befektetők már 228%-os hozamot könyvelhetnek el.
2026. 01. 10. 23:00
Megosztás:

Rekordévet zárt a Binance: 34 billió dollárnyi kriptokereskedés, 300 millió felhasználó

A Binance 2025-ben minden eddiginél erősebb évet zárt – nemcsak kereskedési volumenben, hanem szabályozói együttműködésben, Web3-fejlesztésekben és intézményi növekedésben is. A „State of the Blockchain 2025” jelentésükben publikált számok új korszakot jeleznek a világ legnagyobb kriptotőzsdéjénél.
2026. 01. 10. 22:01
Megosztás:

Cardano árfolyam előrejelzés: Lehetséges egy ugrás 2 dollárig? A Shiba Inu szárnyal, de a Digitap még nagyobb figyelmet kap

A 2025-ös év gyenge zárása után a Cardano és a SHIB árfolyama is emelkedni kezdett. Mivel heti szinten két számjegyű növekedést mutatnak, számos ismert kriptoinfluenszer is felfigyelt rájuk. Például a More Crypto Online úgy véli, hogy az ADA árfolyama hamarosan elérheti a 2 dollárt.
2026. 01. 10. 21:00
Megosztás:

A Bitcoin lehet a jövő strukturális eszköze a globális pénzpiacokon

A világ vezető intézményi befektetői közül egyre többen tekintenek úgy a Bitcoinra, mint a globális pénzügyi rendszer lehetséges jövőbeli alappillérére – nem csupán egy spekulatív eszközre. A VanEck legfrissebb elemzése szerint a Bitcoin strukturális szerepet kaphat a nemzetközi piacokon a következő évtizedekben.
2026. 01. 10. 20:00
Megosztás:

Már 22 ezer édesanya kérte az szja-mentességet

Az adóhivatal online rendszerében már 33 ezren kérték a családi kedvezményt, és több mint 22 ezer édesanya is itt jelezte az anyakedvezmények igénybevételét - ismertette szombati közleményében a Nemzeti Adó- és Vámhivatal (NAV), egyben felhívta a figyelmet arra, hogy nem érdemes halogatni az adóelőleg-nyilatkozatot, hiszen az űrlapok pár perc alatt kitölthetők.
2026. 01. 10. 19:00
Megosztás:

Az Egyesült Államok mindenképpen lépni fog Grönland ügyében

Az Egyesült Államok mindenképpen lépni fog Grönland ügyében – hangoztatta Donald Trump elnök pénteken.
2026. 01. 10. 18:00
Megosztás:

Napi rekordot döntött meg a hóesés Moszkvában

Félévszázados napi rekordot döntött meg a Moszkvában pénteken lehullott csapadékmennyiség - közölte az Oroszországi Föderáció Hidrometeorológiai Központja szombaton a TASZSZ hírügynökséggel.
2026. 01. 10. 17:00
Megosztás:

2026-os Bitcoin felhőbányászati útmutató kezdőknek: Regisztrálj és kapj 100 dollárt; csatlakozz a Fleet Mininghez egy alacsony belépési küszöbű passzív jövedelmi lehetőségért

A Bitcoin ára 2026-ban továbbra is ingadozó, azonban a hálózat stabilitását és az eszköz hosszú távú értékét egyre szélesebb körben ismerik el a nagyközönség körében. A hagyományos Bitcoin-bányászat bonyolult és költséges művelet, ezért sok új érdeklődőt elriaszt.
2026. 01. 10. 15:57
Megosztás:

Innovatív magkezelési megoldást fejlesztenek a Szegedi Tudományegyetemen

Marik Tamás, a Szegedi Tudományegyetem (SZTE) mikrobiológusa a magkezelésnél alkalmazható növénykondícionáló és terméshozam-növelő készítmény prototípusán dolgozik, amely aktív hatóanyag segítségével már egyszeri kezelés után is képes serkenteni a növények növekedését és növelni a terméshozamot - tájékoztatta a felsőoktatási intézmény közkapcsolati igazgatósága az MTI-t.
2026. 01. 10. 15:00
Megosztás: