Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Visszafogottan ünnepel a magyar lakosság kétharmada

A lakosság majdnem kétharmada kevesebb, mint 50 ezer forintot költ a karácsonyra, és több mint felük takarékoskodással vagy akár kölcsönből fedezi az év végi kiadásokat. Ajándékot a legtöbben csak a közeli családtagoknak vásárolnak, ugyanakkor minden tizedik ember egyáltalán nem ajándékoz – derül ki a CIB Bank kérésére készült friss, reprezentatív felmérésből1, amelyben a magyar lakosság ünnepi kiadásaira, ajándékozási szokásaira voltak kíváncsiak.
2024. 12. 15. 07:00
Megosztás:

Tízből négy német vállalat tervez leépítést 2025-ben

A megkérdezett német vállalatok 38 százaléka tervezi munkahelyek megszüntetését az IW (Institut der deutschen Wirtschaft) gazdaságkutató intézet legfrissebb felmérése szerint.
2024. 12. 15. 06:00
Megosztás:

A magyarok közel fele szerint munkája a következő öt évben megváltozik a mesterséges intelligencia miatt

Magyarországon az emberek 45 százaléka úgy véli, munkáját a következő öt évben a mesterséges intelligencia (AI) komolyan megváltoztatja, a válaszadók kevesebb mint negyede szerint pedig el is veszi, míg világszerte ez az arány 60, illetve 36 százalék - közölte az Ipsos 32 országra kiterjedő felmérése alapján a K&H Bank szombaton az MTI-vel.
2024. 12. 15. 05:00
Megosztás:

Kötelező kivitelezői felelősségbiztosítási szabályok 2025

Az építészeti törvényhez már számos végrehajtási rendeletet alkotott a jogalkotó és továbbiak is várhatóak a közeljövőben. Jelen cikkünkben a friss végrehajtási rendeleti joganyagból az új, általánosan kötelező kivitelezői felelősségbiztosításról szóló legfontosabb tudnivalókat mutatjuk be, figyelemmel arra, hogy a vállalkozó kivitelezőnek 2025. január 15-től kell rendelkeznie ilyen felelősségbiztosítással.
2024. 12. 15. 04:00
Megosztás:

Ajándékot, de mit és melyik boltból?

A karácsonyi ajándékozás során a fiatalok körében a ruhák vannak fölényben, 67 százalékuk készül ilyen meglepetéssel az ünnepekre. A kozmetikumok is jól állnak, 64 százalék választana belőlük, valamint a játékok és az élelmiszerek is népszerűnek mondhatóak a K&H ifjúsági index szerint, amely a karácsonyra való felkészülést vizsgálta. Kiderült az is, hogy a készpénz, mint ajándék csak 28 százalékuknál merül fel.
2024. 12. 15. 03:00
Megosztás:

Pénzeső hull 5 csillagjegyre a jövő héten, mutatjuk, mit kell tenned érte!

Kíváncsi vagy, mit tartogat számodra a jövő hét pénzügyi szerencséje? Vajon egy váratlan lehetőség, egy jól időzített kaparós sorsjegy, vagy egy izgalmas lottójáték hozza meg számodra az ünnepek előtti bőséget? Olvasd el a horoszkópod, és derítsd ki, hogyan fordíthatod az univerzum energiáit a javadra a következő napokban!
2024. 12. 15. 02:00
Megosztás:

Ha Ön is 1948-1972 között született, akkor van oka a félelemre

Az 1948 és 1972 között született generációt gyakran illetik a baby boom nemzedék vagy annak későbbi hulláma elnevezéssel. Ez a korcsoport élete során számos társadalmi és gazdasági átalakulást élt át, most pedig új kihívásokkal kell szembenéznie, ahogy közeledik az időskorhoz. Az alábbiakban összefoglaljuk azokat a legfontosabb kockázatokat, amelyek erre a generációra jellemzőek.
2024. 12. 15. 01:00
Megosztás:

A 400 fölötti forint megmozgatta a magyarok befektetéseit

Az ősszel hosszú idő után ismét a lakosság lélektani határa fölé gyengülő forint hatására ezúttal csökkentek a devizabetétekben tartott megtakarítások, miközben a forintbetétek összege több száz milliárddal nőtt. Az értékpapírok közül újra a befektetési alapok voltak a kisbefektetők nagy kedvencei, miközben állampapírok iránti kereslet megcsappant októberben - derül ki a Bank360.hu elemzéséből.
2024. 12. 15. 00:01
Megosztás:

Karácsonyi bikapiac kedvencei: 5 érme, amelyek 30.000%-os növekedést céloznak meg az ünnepi szezonban

Itt az ünnepi szezon, és a kriptopiac izgalomtól pezseg. Öt digitális valuta is szóba került, amelyek elképesztő növekedést mutathatnak az elkövetkező hetekben. Vajon ezek az érmék lesznek az ünnepi időszak meglepetés sztárjai? Nézzük meg, mely kriptovaluták vonzzák a figyelmet, és miért emelkedhetnek ki az év végi rally során.
2024. 12. 14. 23:00
Megosztás:

Rejtett kriptolehetőségek: 3 altcoin, amelyekből 100 dollár akár 100.000 dollár is lehet!

Ahogy a kriptopiac 2024 decemberében szárnyal, a figyelmet eddig mellőzött altcoinok vonzzák magukra, jelentős növekedési potenciált ígérve. A befektetők ezeket a rejtett gyöngyszemeket kutatják, lehetőséget keresve arra, hogy szerény befektetéseikből komoly nyereséget érjenek el a bikás hangulat közepette.
2024. 12. 14. 22:00
Megosztás:

Nulláról a csúcsra: Elemzők felfedik, melyik érme lőhet ki legközelebb, és hozhat hatalmas, akár 100-szoros nyereséget!

Egy viszonylag ismeretlen kriptovaluta kelti fel az iparági szakértők figyelmét. Elemzők úgy vélik, hogy ez a digitális érme hatalmas áttörés előtt állhat. A becslések szerint értéke az egekbe szökhet, potenciálisan akár 100-szorosára növelve a befektetéseket.
2024. 12. 14. 21:00
Megosztás:

Bennfentes útmutató a nagy nyereségekhez a 2025-ös kriptobikapiacon!

Ahogy a kriptopiac 2025-ben példátlan magasságokba emelkedik, új lehetőségek nyílnak azok számára, akik készek kihasználni ezt a pénzügyi fellendülést.
2024. 12. 14. 20:00
Megosztás:

XYZVerse vs. Moo Deng vs. PNUT: Melyik mémcoin lesz december és január sztárja?

Ahogy a Bitcoin átlépi a 100.000 dolláros határt, és az altcoinok példátlan magasságokat érnek el, a kriptopiac izgalomtól pezseg.
2024. 12. 14. 19:00
Megosztás:

A stagnáló mémcoin piac lehetőségeket teremt – 4 legjobb érme, amit érdemes megvenni, mielőtt kilőnek!

Ahogy a bizonyos digitális tokenek iránti izgalom alábbhagy, egy ritka lehetőség bontakozik ki a láthatáron. Ez a piac csendes időszaka a következő nagy mozgás előjele lehet. Bizonyos kriptovaluták rendkívüli növekedési potenciált mutatnak, így most lehet a legmegfelelőbb pillanat arra, hogy megvizsgáljuk ezt a négy ígéretes eszközt, mielőtt berobbannának.
2024. 12. 14. 18:00
Megosztás:

Így alakult a 2024-es év a belvárosi ingatlanpiacon

A 2024-es év eleje némi élénküléssel indult a budapesti belvárosi ingatlanpiacon, amit voltaképpen a 2023-as év végi hagyományos fellendülés táplált tovább. A Central Home szakértője, Ben-Ezra Orran szerint a kereslet a korábbi évekhez képest fokozatosan nőtt, különösen az újszerű, kétszobás lakások iránt. A piacon tapasztalható árak tovább emelkedtek, sok esetben meghaladva az infláció mértékét, különösen az V., VI., VII. és XIII. kerületek kiemelt területein.
2024. 12. 14. 17:00
Megosztás:

BONK és PEPE figyelmeztetés: Ez a mémcoin 3 millió dollárt gyűjtött előértékesítésben, és egyre nagyobb lendületet vesz!

Egy új mémcoin hívja fel magára a figyelmet a kriptovilágban, miután 3 millió dollárt gyűjtött előértékesítése során.
2024. 12. 14. 16:00
Megosztás:

Szlovákia is leminősítést kapott

Leminősítette Szlovákiát a Moody's Ratings, mindenekelőtt a szlovákiai gazdaság intézményi környezetének folyamatos romlásával indokolva a döntést.
2024. 12. 14. 15:00
Megosztás:

Részhajránál előzött a Tesla, a Model Y az első ötszázas típus a vállalati e-autó pályázaton

A Tesla terméke érte el elsőként a félezres igényelt darabszámot a 30 milliárd forintos keretösszegű vállalati e-autó pályázaton. Sokáig a BYD ATTO 3 vezette a mezőnyt a legnépszerűbb típusok rangsorában. A Model Y folyamatos felzárkózás után a közelmúltban vette át az első helyet, most pedig a kérelmek alapján elsőként érte el az 500 darabot - jelentette be hivatalos Facebook-oldalán pénteken az Energiaügyi Minisztérium (EM).
2024. 12. 14. 14:00
Megosztás:

December 31-ig lehet igénybe venni a 280 ezer forintos adó-visszatérítést!

Az idei évre vonatkozó adó-visszatérítést arra az összegre lehet igénybe venni, amit a nyugdíj-megtakarítási számláinkra legkésőbb december 31-ig befizetünk. Ez 20%-os szja-jóváírást jelent azoknak, akik nyugdíj-előtakarékossági számlával (NYESZ), nyugdíjbiztosítással vagy önkéntes nyugdíjpénztárral takarítanak meg. A money.hu szakértői megnézték, mekkora befizetésekkel tudjuk maximalizálni az éves adókedvezményt.
2024. 12. 14. 13:00
Megosztás:

Új vezérigazgatót neveznek ki a K&H-nál

Új vezérigazgatót neveznek ki a K&H-nál január 1-jével, Peter Roebben, a KBC Csoport bolgár egységének jelenlegi vezérigazgatója veszi át Guy Libot magyarországi vezérigazgatói szerepét, az illetékes hatóságok jóváhagyásától függően - közölte a K&H Bank pénteken az MTI-vel.
2024. 12. 14. 12:00
Megosztás: