Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik. A rendszer a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Magyarország is bekapcsolódik a digitális nyelvi forradalomba a Mesterséges Intelligencia Nemzeti Laboratórium fejlesztésével

A magyar nyelvű szövegek mesterséges intelligencia alapú elemző algoritmusai körülbelül 2010-ig lépést tartottak a nagy világnyelvek digitális fejlődésében, aztán lemaradtunk: az új módszerek a sokak által beszélt nyelveknek kedveztek. Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel.

A most elkészült HuSpaCy rendszer ezen a területen tud segíteni: használatával egyszerűbb a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

„A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, ami valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek is által értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár email értelmező rendszerekhez is” – magyarázza Farkas Richárd, a Szegedi Tudományegyetem kutatója.

MI forradalom a nyelvtechnológiában

Az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az ún. tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására. Ilyen ismertebb mélytanulásos módszer például a BERT vagy az OpenAI GPT-3 algoritmusa.

Az ilyen rendszerekkel viszont van egy probléma: alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak. Gondoljunk bele, hogy egy ilyen rendszer dönt arról, kaphatunk-e hitelt vagy sem. Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik (pl. könnyen értelmezhető egy gépi hitelbírálat eredménye is), és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer generációváltás: ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, stb.) illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben. A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek.

“A HuSpaCy a spaCy keretrendszerbe illeszkedik, ami az elmúlt években kvázi nemzetközi sztenderddé vált Ezt az eszközt használják mind akadémiai és ipari projektekben a világ számos nyelvén és pontján. Így, minden a keretrendszerbe illeszkedő nyelv gyakorlatilag bekapcsolódik a digitális nyelvi forradalomba” - mondja Orosz György, a HuSpaCy projekt vezetője.

A most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

A rendszer ide kattintva kipróbálható.

A MILAB-ban futó egyéb nyelvtechnológiai projektek:

-    Hangalapú időpont-egyeztető chatbot: Mi lenne ha amikor telefonon felhívjuk a fodrászunkat, egy szerelőt, orvosunkat vagy éppen a nagyon elfoglalt barátunkat, hogy egy időpontot egyeztessünk, akkor egy robottal beszélgetve tudnánk egy mindkettőnknek megfelelő időpontot egyeztetni? A Szegedi Tudományegyetem és a Budapesti Műszaki Egyetem együttműködésben elkészítettük egy ilyen, magyarul beszélő, hangalapú  időpont-egyeztető robot kipróbálható demó változatát.

-    Szövegek érzelmi töltetének azonosítása: nagy mennyiségű szöveges tartalom (például szociális média) automatikus elemzése abból a szempontból, hogy milyen érzelmi töltetet (düh, szomorúság, öröm stb) fejez ki a közlő igen hasznos lehet marketing vagy szociológiai vizsgálatok szempontjából. Az ELKH  Társadalomtudományi Kutatóközpontban elkészültek tanító adatbázisok és elemzők magyar nyelvű szöveges tartalmak érzelmi töltet elemzésére.

-    Szerző- és beszélő azonosítás: A Nemzetbiztonsági Szakszolgálat munkatársainak munkájának támogatására elkészült egy rendszer, ami két szöveg összehasonlító elemzését végzi el, a szerzők nyelvhasználati, stilisztikai, helyesírási stb  szempontokból, ami például névtelen fenyegető levelek esetén támogatja a kriminalisztikai szakértők munkáját. Folyamatban van beszédhang alapján történő beszélő-azonosító rendszer fejlesztése is, ami például névtelen fenyegető betelefonálásoknál segít megállapítani, hogy ugyanaz-e a beszélő.

-    Gépi olvasás szövegértés: az iskolai olvasás szövegértési feladatok során a diákok elolvasnak egy szöveget és ez alapján kell kérdéseket megválaszolniuk. Egy olyan magyar nyelvű  tanító és benchmark adatbázist építettünk, aminek a célja, hogy egy gép mennyire képes ilyen

Hagyományok és locsolkodás – mit jelentett régen a húsvét a magyar falvakban?

A húsvéti néphagyományok mélyen gyökereznek a magyar kultúrában, különösen a falusi élet mindennapjaiban. Ezek a szokások nemcsak vallási jellegűek, hanem a tavasz beköszöntéhez, a természet újjáéledéséhez és a közösségi élethez is kapcsolódnak.
2025. 04. 20. 10:00
Megosztás:

Az Egyesült Államok több városában is tüntetéseket tartottak Trump ellen

Az Egyesült Államok több városában tüntetéseket tartottak a Trump-adminisztráció politikája ellen tiltakozva szombaton.
2025. 04. 20. 09:00
Megosztás:

Húsvéti kihívás a természetben - mozgással az egészségért

A húsvéti hosszú hétvége sokak számára a bőséges étkezésekről és a pihenésről szól. Idén azonban érdemes lehet a friss levegőn töltött, aktív kikapcsolódást is beiktatni a programba - hívja fel a figyelmet a Nagy Sportágválasztó, BBU Nonprofit Kft. csapata.
2025. 04. 20. 07:00
Megosztás:

Hamarosan újra féláron fagyizhat az ország!

2025. május 8-án ismét megrendezik a Magyar Fagylalt Napját, amikor az eseményhez csatlakozó cukrászdák és fagyizók országszerte féláron kínálják a fagylaltgombócokat.
2025. 04. 20. 05:00
Megosztás:

3. Húsvéti finomságok – mi kerül a magyar ünnepi asztalra?

A húsvéti ünnepek alatt a magyar háztartásokban bőséges, hagyományos ételek kerülnek az asztalra. A 40 napos böjt után végre ismét hús, tojás, kalács és más finomságok fogyaszthatók – a lakoma a fizikai és lelki megújulás része.
2025. 04. 20. 04:00
Megosztás:

Döbbenetes bejelentés Zelenszkij-től: a háború nagy fordulata?

Volodimir Zelenszkij ukrán elnök állítása szerint legalább 155 kínai állampolgár vesz részt az orosz oldalon az ukrajnai háborúban, miközben Peking visszautasítja ezt, és azt állítja, hogy igyekszik távol tartani állampolgárait a fegyveres konfliktustól – számolt be róla a BBC.
2025. 04. 20. 03:00
Megosztás:

40 fokon mosod a ruhákat? Jó nagy butaságot csinálsz!

Ön milyen hőfokon szokta mosni a ruhákat? Talán Ön is 40 fokon mos, ahogy a legtöbb magyar háztartásban megszokott? Cikkünkben szakértői véleményre támaszkodva bemutatjuk, miért lehet ez a választás kevésbé előnyös, és milyen mértékben csökkenthetjük az áramfogyasztást, ha tudatosabban választjuk meg a mosási hőmérsékletet – akár ruhák, törölközők vagy ágyneműk esetében.
2025. 04. 20. 02:00
Megosztás:

RENDKÍVÜLI! Tűzszünetet hirdetett Putyin

Vlagyimir Putyin orosz államfő húsvéti fegyvernyugvást hirdetett az ukrajnai háborús helyzetben, amely szombat este veszi kezdetét, és vasárnap éjfélig tart – jelentette a The Guardian.
2025. 04. 20. 01:00
Megosztás:

Döntöttek! A nyugdíjasoknak mostantól már nem kell sorban állniuk sem!

A Magyar Államkincstár Nyugdíjfolyósító Igazgatósága új elektronikus szolgáltatásai révén a nyugdíjjal kapcsolatos ügyek kényelmesen, otthonról is intézhetők, így nem szükséges személyesen felkeresni az ügyfélszolgálatot, elkerülhető az utazás és a sorban állás. Hogyan működik mindez? Mutatjuk, nem bonyolult!
2025. 04. 20. 00:01
Megosztás:

Magyar fejlesztés nyújthat védelmet szívroham, stroke és transzplantáció okozta szervkárosodás ellen

Az EvolVeritas cég egyedülálló hatóanyaga, az EVO24L megvédi a szervezetet az oxigénhiányt követő károsodástól. Ha egy ér, akár szervátültetés, szívinfarktus vagy stroke esetében elzáródik, az érintett szerv oxigénhiányt szenved, és a sejtek vészjeleket juttatnak a felszínükre. Bár a vérellátás sebészi, vagy gyógyszeres kezeléssel helyreállítható, ezzel egy reperfúziós sérülésnek nevezett folyamatot is elindítanak. Ennek oka, hogy az oxigént és tápanyagokat biztosító vérrel immunfehérjék is érkeznek, melyek a vészjeleket felismerve megtámadják az érintett szervet. Az EvolVeritas szabadalommal védett hatóanyaga ezt védi ki az immunválasz célzott gátlásával. Az EVO24L állatkísérletekben hatékonynak bizonyult. Az átütő eredményt a rangos PNAS lapban közölték.
2025. 04. 19. 22:00
Megosztás:

Húsvét: A kereszténység legnagyobb ünnepe – mit is ünneplünk valójában?

A húsvét a keresztény egyház legfontosabb ünnepe, még karácsonynál is jelentősebb, hiszen nem csupán Jézus születésére, hanem a megváltás aktusára, az emberiség üdvösségének reményére emlékezünk. Ez az ünnep a halál feletti győzelmet és az örök élet ígéretét hordozza, amely a kereszténység központi üzenete.
2025. 04. 19. 21:00
Megosztás:

A tavaszi szünetben nosztalgiajáratok is közlekednek a Gyermekvasúton

A budapesti Gyermekvasút a húsvéti hétvégén is várja a kirándulókat, a vonatok 40-50 percenként indulnak a végállomásokról, és a tavaszi szünetben nosztalgiajáratok is közlekednek - közölte a MÁV Magyar Államvasutak Zrt. Kommunikációs Igazgatósága szombaton az MTI-vel.
2025. 04. 19. 19:00
Megosztás:

Hogyan formálja át a mindennapjainkat a ragasztószalag?

Az irodai élet kelléktára számos nélkülözhetetlen eszközzel van tele, amelyek közül a ragasztószalag különösen fontos szerepet tölt be. Ez az egyszerű, ámde nagyszerű tárgy segít a csomagolásban és az apróbb irodai feladatok megoldásában egyaránt.
2025. 04. 19. 18:00
Megosztás:

Tovább tarthatnak nyitva a brit pubok a második világháború európai győzelmének évfordulóján

A törvényben előírt záróránál két órával tovább tarthatnak nyitva a brit pubok a második világháború európai hadszínterein aratott szövetséges győzelem 80. évfordulóján.
2025. 04. 19. 17:00
Megosztás:

MÁV: forgalomba állt az első Henschel dízelmozdony a Balaton északi partján

A MÁV új dízelmozdonya csütörtöktől a Balaton északi partján, Balatonfüred és Tapolca között teljesít szolgálatot - közölte a MÁV-csoport vezérigazgatója csütörtökön a Facebookon.
2025. 04. 19. 16:00
Megosztás:

Ethereum árfolyam elemzés – ETH kriptovaluta technikai előrejelzés április közepén

Ethereum technikai elemzés, ETH árfolyam árfolyam előrejelzés rövid-, közép- és hosszú távra. Az Ethereum (ETH) árfolyama az elmúlt hetekben jelentős gyengülésen ment keresztül, és jelenleg kritikus technikai szinteken próbál stabilizálódni. A vezető altcoin – amely a decentralizált alkalmazások és az okosszerződések alapját képezi – újra a befektetői figyelem középpontjába került.
2025. 04. 19. 15:00
Megosztás:

Orbán Viktor: a magyar-amerikai tárgyalásoknak fél éven belül érezhető lesz az eredménye

A magyar-amerikai tárgyalásoknak fél éven belül érezhető lesz az eredménye - mondta Orbán Viktor miniszterelnök a Facebook-oldalára szombaton feltöltött videóban.
2025. 04. 19. 14:00
Megosztás:

Bitcoin árfolyam elemzés – BTC kriptovaluta technikai előrejelzés április közepén

Bitcoin technikai elemzés, BTC árfolyam előrejelzés. A Bitcoin (BTC), a világ legismertebb és legértékesebb kriptovalutája ismét fontos technikai szintek közelében mozog. Az elmúlt hónapok árfolyam-ingadozásai után sok befektető számára felmerül a kérdés: vajon most érdemes vásárolni, eladni vagy inkább kivárni?
2025. 04. 19. 13:00
Megosztás:

Trump vámjai új szerepbe taszíthatják a Bitcoint: infláció elleni menedék lehet a legnagyobb kriptovalutából

Ahogy Donald Trump vámháborús retorikája ismét napirendre kerül, egyes elemzők szerint ennek hatása túlnyúlhat a kereskedelmi fronton – egészen a digitális arany világáig. A Messari elemzője szerint a Bitcoin elszakadhat az amerikai részvénypiactól, és valódi inflációs menedékké válhat, különösen, ha az amerikai dollár globális szerepe meginog.
2025. 04. 19. 12:00
Megosztás:

Megkezdte tevékenységét az első greentech és mesterséges intelligencia fókuszú inkubátor

Megkezdte tevékenységét az első, kifejezetten greentech és mesterséges intelligencia fókuszú inkubátor - közölte az Incubator Zero Zrt. az MTI-vel.
2025. 04. 19. 11:00
Megosztás: