Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Emelkedett a BUX a kedvező európai hangulatban

A Budapesti Értéktőzsde részvényindexe, a BUX 666,08 pontos, 1,47 százalékos emelkedéssel, 45 883,27 ponton zárt szerdán.
2023. 02. 08. 18:30
Megosztás:

PwC Vezérigazgató Felmérés: Nem tervez létszámcsökkentést a magyar vezetők többsége

A magyarországi cégvezetők többsége a világ- és a magyar gazdaság növekedésének egyértelmű lassulására számít 2023-ban, azonban a hazai gazdaság helyzetét még törékenyebbnek érzik a globálisnál – derül ki a PwC Magyarországi Vezérigazgató Felméréséből. A gazdasági növekedésre leselkedő legnagyobb veszélynek az energiaválságot gondolják, melyet az infláció és a makrogazdasági volatilitás követ. Erre az évre 15%-os inflációs rátát és 421 forintos euróárfolyamot jósolnak. A pesszimista kilátások ellenére a hazai vezetők zöme nem tervez létszámleépítést és a javadalmazások mérséklését sem, ehelyett a működési költségek csökkentésével és az árak emelésével enyhítenék a válság hatásait.
2023. 02. 08. 18:00
Megosztás:

2 milliárd forintos bérfejlesztés a MediaMarkt-nál

A MediaMarkt a munkavállalói megtartásának érdekében 25 éves magyarországi fennállásának legnagyobb bérfejlesztésével válaszolt a koronavírus-járvány óta kialakult gazdasági helyzetre. A több lépcsőben megvalósított, összesen 2 milliárd forintos bérfejlesztés mellett a társaság általános munkáltatói márkaépítésbe, valamint külső és belső stratégiai megújulásba kezdett.
2023. 02. 08. 17:30
Megosztás:

Töretlen az arany népszerűsége

Több mint hárommilliárd forint értékben vásároltak befektetési célú aranyat 2022-ben a BÁV Zálog fiókhálózatában. Ez az érték a 2021-es forgalom háromszorosának felel meg, ami nagyrészt annak tudható be, hogy a bizonytalan gazdasági helyzetben, a magas inflációs környezetben a legbiztosabb eszközöket igyekeznek megtalálni a befektetők. Éppen ezért nemcsak az aranytömbök, hanem a használt és az új ékszerek forgalma is jelentősen, mintegy másfélszeresére nőtt egy év alatt.
2023. 02. 08. 17:00
Megosztás:

Az élelmiszeráremelkedés az életszínvonal-csökkenés fő okozója

A magyarok arra számítanak, hogy a következő egy évben tovább romlik az életszínvonaluk, az élelmiszer drágulása jelenti a legnagyobb problémát – többek között ez derül ki az Aegon friss, reprezentatív kutatásából, amiben a magyar embereket kérdezték anyagi helyzetükről, kilátásaikról. Miközben sokan látják elég borúsan a jövőt, a kihívásokkal teli gazdasági helyzet egyre inkább rávilágít arra, hogy mennyire fontos az anyagi tervezés, a megtakarítás és a hosszú távú öngondoskodás.
2023. 02. 08. 16:30
Megosztás:

Oktatási Hivatal: február 15-ig lehet jelentkezni az érettségire

Még egy hétig, 2023. február 15-ig lehet jelentkezni a május-júniusi érettségi vizsgákra - tudatta az Oktatási Hivatal (OH) szerdán az MTI-vel.
2023. 02. 08. 16:00
Megosztás:

Az általános iskolások környezettudatosságának növelését segítő program indul

A kormány kiemelt hangsúlyt fektet a környezeti nevelésre és a szemléletformálásra, amelynek fontos pillérei a környezeti nevelési programok. A Környezetvédelmi Szolgáltatók és Gyártók Szövetsége az Energiaügyi Minisztérium (EM) támogatásával, a Belügyminisztérium és az Országos Meteorológiai Szolgálat együttműködésével új szemléletformáló programot indít általános iskolások számára - közölte az Energiaügyi Minisztérium szerdán az MTI-vel.
2023. 02. 08. 15:30
Megosztás:

Tüzifa-csalót értek tetten a Nébih ellenőrei

Közös akcióban értek tetten egy facebookos tűzifa-csalót a Nógrád Vármegyei fogyasztóvédelmi hatóság és a Nemzeti Élelmiszerlánc-biztonsági Hivatal (Nébih) ellenőrei - közölte a hivatal az MTI-vel szerdán.
2023. 02. 08. 15:00
Megosztás:

154 millió euró volt a termék-külkereskedelmi hiány decemberben

Tavaly decemberben az export euróban számított értéke 12, az importé 9,9 százalékkal nagyobb volt az előző év azonos időszakinál. A termék-külkereskedelmi egyenleg 204 millió euróval javult - jelentette szerdán első becslése alapján a Központi Statisztikai Hivatal (KSH).
2023. 02. 08. 14:30
Megosztás:

Közelebb került az uniós döntéshozatalhoz a magyar logisztika

Szövetségre lépett a hat meghatározó hazai logisztikai szakmai szervezet alkotta Magyar Logisztikai Kapcsolattartó Bizottság (MLKB) és az Európai Szállítmányozási, Szállítási, Logisztikai és Vámszolgáltatási Szövetség, a CLECAT, amelyet a logisztika szócsövének is hívnak az európai uniós intézményrendszerben.
2023. 02. 08. 14:00
Megosztás:

A Danone megnyitotta legnagyobb európai kutatási központját

2023 február 6-án nyílt meg a Danone új kutatási és innovációs központja, a Daniel Carasso Center a Paris-Saclay területén.
2023. 02. 08. 13:30
Megosztás:

Tovább emelkedik a kőolaj ára a kínai optimizmusra

A WTI 77,8, a Brent 83,9 dollár volt hordónként az áprilisi lejáratra, míg az Ural európai azonnali ára 55,1 dollárt tett ki.
2023. 02. 08. 13:00
Megosztás:

Tovább bővítette ipari területét a Continental Dohányipari Csoport Sátoraljaújhelyen

A 2022 novemberében sikeresen lezárt, közel 10 milliárd forint értékű beruházását követően folytatja növekedési terveinek megvalósítását a Continental Dohányipari Csoport. A január elején aláírt szerződés értelmében a hazai dohányipar meghatározó szereplője 8000 m2 ipari területtel gazdagodott, a társaság által birtokolt, több mint 130 éves múltra visszatekintő sátoraljaújhelyi dohánygyár közvetlen szomszédságában. A megvásárolt területet a bővülő előkészítési kapacitás következtében keletkező raktárkapacitási hiányok enyhítésére kívánja felhasználni a cégcsoport.
2023. 02. 08. 12:30
Megosztás:

Mi aggasztja a világ polgárait?

Bevonult a hétköznapok szókincsébe a „fenntarthatóság” kifejezés. Egy 34 országra kiterjedő kutatás szerint az embereket aggasztó problémák között a leggyakrabban elhangzó fogalmak – így a „környezetvédelem”, a „hulladék”, az „éghajlatváltozás”, valamint a „megfizethető és tiszta energia” – mind szorosan kapcsolódnak a fenntarthatóság ügyéhez. Suba Levente, a K&H Csoport fenntarthatósági programvezetője szerint minden egyénnek és vállalatnak először önmagán kell kezdenie a változást.
2023. 02. 08. 12:00
Megosztás:

Télen melegre vágynak a magyar utazók és Ausztriába

Ausztria bizonyult a legnépszerűbb utazási célpontnak a magyarok körében 2022 utolsó hónapjában a Bank360.hu utasbiztosítási adatai alapján. A legdrágább szerződést egy két hónapos ausztráliai tengerparti nyaralásra kötötték 160 ezerért két főnek, míg a legolcsóbbakat 225 forintért egynapos osztrák utakra.
2023. 02. 08. 11:34
Megosztás:

Vajon mi ez a nagy árzuhanás a vajon? A Lidl is beszáll a nagy vaj árcsökkentésbe!

A Lidl Magyarország a mai naptól jelentős mértékben és tartósan csökkenti a kínálatában található, legnépszerűbb vajak árát. Az intézkedésnek köszönhetően az érintett termékek 21, illetve 25 százalékkal olcsóbban érhetőek el a Lidl áruházakban, ami a fogyasztók számára jelentős megtakarítást eredményezhet.
2023. 02. 08. 11:30
Megosztás:

A Fed becsült kamatcsúcsa csak egy „puha érték”

Tegnap Jerome Powellé volt a főszerep, aki a Fed egy héttel ezelőtti kamatdöntő ülése óta először szólalt meg.
2023. 02. 08. 11:00
Megosztás:

Téveszmék, és tévhitek a téligumikról, melyeket soha nem szabad megfogadnunk, ha biztonságosan szeretnénk közlekedni

Nagyon sok téveszmét, és tévhitet lehet olvasni a különböző felületeken a téli gumikkal kapcsolatban, melyek sok veszélyt tartogatnak számunkra, ezért jobb őket eloszlatni, megelőzve a veszélyes balesetek kialakulását. Ahogy ősszel elkezd lehűlni a hőmérséklet, egyből elkezdenek innen-onnan előszivárogni a téli gumiabroncsokkal kapcsolatos tévhitek, melyek főleg arról szólnak, hogy felesleges a téli gumikat használni, vagy hogy csak akkor kell felszerelni azokat, ha már fagypont alatti hőmérséklet van odakint.
2023. 02. 08. 10:30
Megosztás:

Pozitív kezdés a főbb európai értékpapírpiacokon

Emelkedéssel indult a kereskedés szerdán a főbb európai értékpapírpiacokon.
2023. 02. 08. 10:00
Megosztás:

Használtautó-horror: minden második autónak vannak rejtett hibái

Bár szinte minden országban gyakoriak a visszaélések a használtautó-piacon, a legnagyobb gond mégis Közép- és Kelet-Európában mutatkozik, ahol számtalan nyugatról importált járművet kínálnak eladásra. Ezeknél az autóknál nagyobb a kockázata, hogy visszapörgetik a kilométerórát, eltitkolják a rejtett hibákat, vagy a félrevezetések egyéb formáját alkalmazzák. A magyarországi járműkereskedők meglehetősen komplex problémára keresik a megoldást: hogyan kerüljék el, hogy rossz állapotú autókhoz jussanak
2023. 02. 08. 09:30
Megosztás: