A Pázmány Péter Katolikus Egyetem Információs Technológiai és Bionikai Karán zajlik a héten a 18. CICLing (Conference on Intelligent text processing and Computational Linguistics) nemeztközi számítógépes nyelvészeti konferencia nemzetközi hírű előadók részvételével.
"A konferencia általános célja megismertetni egymást a különböző országokban folyó nyelvtechnológiai kutatások eredményeivel. Az intelligens szövegfeldolgozás ma már mindennapjaink része, ezért nem véletlen, hogy az előadók között sokszor megtalálni a legnagyobb világcégek, a Google, az IBM vagy idén éppen a Facebook ezzel a témával foglalkozó kutatóit" – mondta el az MTI-nek Prószéky Gábor, a tanácskozás szervezőbizottságának tagja.
Az intelligens szövegfeldolgozást és a számítógépes nyelvészetet az utóbbi időben az elérhető szövegek hatalmas mennyiségének és a feldolgozó eszközök kapacitásának növekedése miatt leggyakrabban ma már egyetlen szóval nyelvtechnológiának nevezik. Ezen a területen nagy sebességgel jelennek meg újabb és újabb módszerek, ezért a CICLIng nem köti a résztvevőket egy-egy szűkebb részterülethez.
A terület fontosságát az egyre több ipari alkalmazás jelzi – fotó: ft.com
A konferencia tematikus szempontból nyitott, csupán az a fontos, hogy akinek a szöveg- vagy beszédfeldolgozás területén új elméleti, illetve a gyakorlatban is jól használható eredménye van, az itt egy szigorú előbírálati rendszeren átjutva beszámolhat róla – fejtette ki a MTA-PPKE Magyar Nyelvtechnológiai Kutatócsoportnak vezetője. A konferenciákon minden évben sok új eredmény jelenik meg, amelyekről a gépi nyelvészeti világ aktuális élvonalát képviselő előadók számolnak be reggeli előadásaikon, majd ugyanaznap délután az adott előadó bevonja a hallgatóságot a saját aktuális kutatásaiba is.
A magyarországi nyelvtechnológia területén zajló kutatásokról Prószéky Gábor elmondta, hogy jelentős kutatás-fejlesztés folyik a házigazda PPKE nyelvtechnológiai kutatócsoportja mellett elsősorban az MTA Nyelvtudományi Intézetében, a Szegedi Tudományegyetemen, a Budapesti Műszaki Egyetemen, a Pécsi Tudományegyetemen vagy az olyan nyelvtechnológiai vállalkozásokban, mint a MorphoLogic, a Precognox, a SpeechTex vagy a Kilgray. A terület fontosságát a hatalmas mennyiségű, mindenki számára elérhető szöveges információ hatékony kereshetősége, a megértés támogatása, a szövegek fordítása, a hangzó beszéd írott szöveggé alakítása és egyre több ipari alkalmazás jelzi.
A magyar közös fejlesztések legújabb eredménye például az MTA támogatásával létrejött új infrastruktúra, amely az eddigi eredmények szabványosításával és integrálásával kialakított digitális nyelvfeldolgozó rendszer. "A magyar nyelv szerkezete jelentősen különbözik a gyakorlatilag minden alkalmazás alapnyelvének számító angoltól, viszont a lokális piacon való megjelenéshez és sikerhez kizárólag a helyi nyelven keresztül vezet az út, a más nyelvre megvalósított nyelvi technológiákat adaptálni kell magyarra is, ami a nyelvek különbségei miatt sok esetben igen bonyolult kutatás-fejlesztési feladat" – fejtette ki a kutató.
A konferenciát 2000 óta rendezik meg minden évben, elindítója és azóta is motorja Alexander Gelbukh mexikói professzor. Rendeztek már hasonló tanácskozást Mexikóban, Indiában, Dél-Koreában, Izraelben, Japánban, Nepálban, Egyiptomban és Törökországban is.