Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Az idén dupla mennyiségű tápadományt kapnak az állatmenhelyek a kormány jóvoltából

Az idén dupla mennyiségű tápadományt kapnak az állatmenhelyek a kormány jóvoltából. A tápadományok kiszállítása pénteken megkezdődött - olvasható az Igazságügyi Minisztérium MTI-hez pénteken eljuttatott közleményében.
2025. 12. 20. 10:00
Megosztás:

A karácsony előtti utolsó napokban is sokat lehet spórolni az Árfigyelővel

Pénzt és időt spórolhatnak a családok a karácsony előtti utolsó napok forgatagában, ha használják az online Árfigyelőt – erre hívja fel a figyelmet a Gazdasági Versenyhivatal (GVH). A GVH által működtetett rendszerben már több mint 5000 különböző élelmiszer-, illetve háztartási termék napi szinten frissülő ára hasonlítható össze, országszerte mintegy 1800 boltban. Egy körültekintően megtervezett nagybevásárlással akár több ezer forintot is lehet spórolni, ráadásul sokkal gyorsabban elintézhető a karácsonyi asztalra, vagy a karácsonyfa alá kerülő termékek beszerzése.
2025. 12. 20. 09:00
Megosztás:

A 4iG Nyrt. befektet az amerikai Axiom Space cégbe

A 4iG Űr- és Védelmi Technológiák Zrt. (4iG SDT) végleges befektetési megállapodást kötött az amerikai kereskedelmi űripar egyik vezető, magántulajdonban lévő vállalatával, az Axiom Space Inc.-vel (Axiom Space). A megállapodás értelmében a 4iG SDT két lépésben megvalósuló tőkeemelést hajt végre az amerikai űripari vállalatban összesen 100 millió USD értékben: 2025. december 31-ig 30 millió USD, míg 2026. március 31-ig 70 millió USD összegben. A megállapodás történelmi lépést jelent a Magyarország és Egyesült Államok közötti űrkutatási és űripari együttműködésben: első alkalommal valósul meg, hogy magyar vállalat amerikai űripari cégben hajt végre befektetést, és ezzel aktív szerepet vállal az űrkutatási ökoszisztéma, valamint az alacsony Föld körüli pályán (LEO) kiépülő kereskedelmi alapú űrinfrastruktúra fejlesztésében.
2025. 12. 20. 08:00
Megosztás:

Az olcsóbb modellek után jövőre a kínai prémiumautók tarolhatják le az európai piacot

Látványosan gyors átalakulás zajlik a magyar autópiacon, amelyen a kínai márkák olcsóbb modelljei villámgyorsan szereztek stabil részesedést. A vásárlók nyitottsága, a kereskedők átalakuló szerepe, az egyszerűbb gyártási és konfigurációs modell, valamint az árak olyan versenykörnyezetet hoztak létre együttesen, amelyben az erős szabályozói nyomásnak is kitett hagyományos márkáknak radikálisan alkalmazkodniuk kell.
2025. 12. 20. 07:00
Megosztás:

Európai egyetem magyar vezetője kapott rangos üzleti díjat

A Fiatal Vállalkozók Hete záróeseményén Noll-Batek Frigyes, a Varsovia Üzleti és Alkalmazott Tudományok Egyetemének prorektora vehette át a FIVOSZ különdíját. A díj elismeri a magyar irányítású Pozsonyi Kihelyezett Tagozat négy év alatti gyors növekedését, az innovációt, a jövő vállalkozóinak és vezetőinek képzése iránti elkötelezettséget. A 2021-ben indult pozsonyi intézmény mára több mint 3000 hallgatót ért el, ezzel a Varsovia lett a legtöbb magyarországi diákot képző külföldi egyetem. A prorektor szerint a siker a közösség, a gyakorlatorientált képzés és a nyitott, ponthatár nélküli felvételi rendszer érdeme, ahol valódi teljesítmény áll a diploma megszerzése mögött.
2025. 12. 20. 06:00
Megosztás:

Jó évet zár a BYD 2025-ben

A BYD kiváló évet zár 2025-ben, az első 11 hónapban összesen 4,182 millió autót gyártott, ez 2024 azonos időszakához viszonyítva 11,3 százalékos növekedés - tájékoztatta a BYD Company Limited az MTI-t közleményben abból az alkalomból, hogy a cég kínai, Jinan városában működő üzemében legyártották a 15 milliomodik NEV (új energiákkal hajtott) autót.
2025. 12. 20. 05:00
Megosztás:

Ekkora hitelre futja a legutóbbi átlagfizetésből

Októberben a magyarországi bruttó átlagkereset már megközelítette a 700 ezer forintot, ami 8,7%-os emelkedést jelent év/év alapon. Ugyanakkor a nettó átlagkereset 482 400 forint, míg a nettó medián kereset 401 100 forint volt, ami 10%-os, illetve 10,3%-os emelkedést jelentett az előző év azonos időszakihoz képest. A reálkereset ennél jóval szerényebb mértékben, 5,5%-kal emelkedett egy év leforgása alatt. A fentiek fényében a Bank360 annak számolt utána, hogy mekkora lakáshitelre, illetve mekkora személyi hitelre elegendő az októberi átlag- és mediánbér.
2025. 12. 20. 04:00
Megosztás:

Vényírási jogosultságot kapnak a gyógyszerészek

A szakmai díjak jubileumi díjátadóján jelentették be a történelmi jelentőségű döntést.
2025. 12. 20. 03:00
Megosztás:

Ha a bruttó béred kisebb, mint 692.700 Ft, akkor rossz hírünk van számodra!

Magyarországon tovább nőttek a jövedelmek: októberben a bruttó átlagkereset elérte a 692 700 forintot, ami 8,7 százalékos növekedést jelent az előző év azonos időszakához képest. A nettó átlagbér ennél is nagyobb ütemben, egy év alatt már 10 százalékkal emelkedett. Mindez kedvező hír azoknak is, akik kölcsön felvételén gondolkodnak, mivel a magasabb fizetés lehetővé teszi nagyobb havi törlesztőrészlet vállalását. Miért fontos ezzel foglalkozni most?
2025. 12. 20. 02:00
Megosztás:

Itt a vége! Az EURÓ árfolyama már nem lesz olcsóbb

Nem várható további forint-erősödés: a gazdasági növekedés átmeneti felgyorsulására számítanak jövőre az OTP Bank elemzői.
2025. 12. 20. 01:00
Megosztás:

Dobáld ki a kukába a sárga csekkeket - itt van helyette a qvik

Mostantól az elektronikus közüzemi számlák is fizethetők qvik fizetéssel a Díjnet online felületén.
2025. 12. 20. 00:01
Megosztás:

Felbontja adásvételi megállapodását az MVM és az E.ON

Közös megegyezéssel megszűnik pénteken az MVM Csoportnak az E.ON Csoporttal 2024. december 16-án kötött adásvételi megállapodása, amely az E.ON Energie Románia 68 százalékos részesedésének, valamint az E.ON Asist Complet 98 százalékos részesedésének megvásárlásáról szól - tájékoztatta az MVM pénteken az MTI-t.
2025. 12. 19. 23:00
Megosztás:

Miért esik ma a piac? Szűkül a likviditás – A Digitap ($TAP) akár nyolcszorozhat, mint banki token, a legjobb kriptovaluta befektetés 2026-ra

A kriptopiac ma vörösen izzik, ahogy a likviditás szűkül, és a kockázati étvágy csökken a digitális eszközök körében. A Bitcoin kulcsfontosságú támaszszintek alá süllyedt, ami megrázta a főbb altcoinokat, például az Ethereumot, az XRP-t, a Solanát és a Cardanót, miközben a piacon félelem uralkodik: a Crypto Fear & Greed Index 22 pontra zuhant.
2025. 12. 19. 21:00
Megosztás:

A geotextília: értékes eszköz a kertészkedéshez

A kertészkedés sok eszközt igényel, de kevés olyan hasznos, mint a geotextília. Ez az anyag nemcsak esztétikai, hanem hőszigetelő és gyomirtó tulajdonságairól is híres. Miért olyan népszerű, és milyen előnyöket nyújthat?
2025. 12. 19. 20:00
Megosztás:

A Konecta és a SPEEEX stratégiai együttműködésre lép

A Konecta, a globális ügyfélélmény- (CX) és digitális szolgáltatások vezető szereplője bejelentette, hogy stratégiai partnerséget kötött a SPEEEX-szel, Koszovó egyik legnagyobb BPO vállalatával. A megállapodás célja, hogy innovatív, közeli kiszervezésű, többnyelvű ügyfélélmény- és digitális megoldásokat nyújtsanak a DACH régió és az európai piacok ügyfelei számára. A koszovói szolgáltatóközpont kulcsfontosságú szerepet tölt majd be: magas színvonalú német nyelvű szolgáltatásokat kínál, valamint angol, francia és olasz nyelvi kapacitással támogatja a komplex, technológia-alapú ügyfélműveleteket.
2025. 12. 19. 19:00
Megosztás:

Optimistább a növekedést illetően az EKB

Az Európai Központi Bank a várakozásunknak és a széleskörű piaci várakozásoknak is megfelelően 2,00%-on hagyta a betéti rátát - olvasható az MBH Bank friss elemzésében.
2025. 12. 19. 18:00
Megosztás:

Dagad a magyar lakossági tartozások, miközben készpénzt is egyre többen vesznek fel hitelkártyával

Közel nyolcéves csúcsra nőtt októberre a hitelkártya-követelések összege, miközben a harmadik negyedévben a megszokott volumen háromszorosára ugrott a hitelkártyás készpénzfelvételek értéke is – hívja fel a figyelmet a BiztosDöntés.hu pénzügyi szakértője. Biztató ugyanakkor, hogy a hitelkártya-követelések nagyjából felét még a kamatmentes időszakban visszafizetik a kártyabirtokosok.
2025. 12. 19. 17:00
Megosztás:

Így támogatta a rászoruló családokat a Magyar Posta az adventi időszakban

Több mint 4 millió forinttal támogatta a rászoruló családokat a Magyar Posta az adventi időszakban - közölte a Magyar Posta Zrt. csütörtökön az MTI-vel.
2025. 12. 19. 16:00
Megosztás:

Alvó Ripple (XRP) aktiválása: Hogyan biztosít a FleetMining új növekedési lehetőségeket a tulajdonosoknak, 100 dolláros regisztrációs bónusszal?

Az XRP egy kriptovaluta, amelynek célja a pénzügyi tranzakciós folyamatok hatékonyabbá, gyorsabbá és olcsóbbá tétele. Úgy tervezték, hogy valós idejű fizetéseket és országon belüli átutalásokat tegyen lehetővé, különösen a pénzügyi intézmények felé.
2025. 12. 19. 14:45
Megosztás:

Beépíthető készülékek: A modern konyha titkos fegyverei

Te hogy látod, mennyire befolyásolja a konyhád hangulatát a háztartási gépek megjelenése? A beépíthető készülékek praktikus megoldásokkal szolgálnak a mindennapokban, ráadásul olyan esztétikai előnyöket kínálnak, amelyek révén a konyhai elemek és a gépek szinte egybeolvadnak. Ennek köszönhetően az elérhető hely is teljes mértékben kihasználható.
2025. 12. 19. 14:00
Megosztás: