MKTT KONFERENCIA 2014

KOMMUNIKÁCIÓ, KREATIVITÁS, KULTÚRA


Szakadát István, Hamp Gábor, Markovich Réka: Goody-listák felismerése és átalakítása

Az előadás kulcsszavai: írásbeliség, grafonyelvi technikák, Goody-lista, médiumspecifikus tudásreprezentáció, gépi szövegfeldolgozás, reguláris kifejezések, jogszabályalkotási munka számítógépes támogatása

Az a felismerés, hogy a médiumok sajátosságai specifikus - vagyis az adott médiumra jellemző - tudásreprezentációkat hoznak létre, nem új keletű. Az írott szöveg pl. használ olyan megoldásokat - Jack Goody kifejezését használva: grafonyelvi technikákat -, amelyek a szöveg rögzítettsége és a vizuális karaktere nyomán jönnek létre, és amelyek a szóbeli átadásban nem alkalmazhatók. Ilyenek a listák, a táblázatok és más szövegrendezési eljárások. Kutatásunkban jogszabályszövegeket vizsgálunk. Ezek a szövegek a mindennapi nyelvhasználathoz képest jóval formalizáltabbak, formai és tagolási szabályait jogszabály rögzíti (61/2009. (XII. 14.) IRM rendelet). Az általunk vizsgált szövegek számos grafonyelvi megoldást használnak, pl. az olyan elliptikus listaelemekből álló felsorolásokat, amelyek csak más szerkezeti egységekkel együtt alkothatnak teljes mondatot. Ezeket a listákat Goody-listáknak neveztük el, és olyan nyelvtechnológiai eljárásokat dolgoztunk ki, amelyek segítéségével Goody-listákat automatizált módon azonosítunk és kategorizálunk. Az elemzéshez jogszabályokból adatbázist hoztunk létre úgy, hogy egy jogszabályi szerkezeti egység alkosson egy rekordot. Az így kialakított tízezer rekordos korpuszunkban előforduló háromezer Goody-listás elliptikus rekordból kétezerkétszáz teljes, szabályos jogi mondat állítható elő. Eredményeink egyfelől jól alkalmazhatók jogszabályi szövegek gépi kezelésében (a jogszabályszövegek propoziciós struktúrájának feltárásában), másfelől fontos felismeréseket nyújtanak a médiaspecifikus tudásreprezentáció problémájához. Az elliptikus Goody-listák sajátosságainak bemutatásához szükséges elemeznünk azt is, hogy - akár az írásos, akár a szóbeli - szövegeinkben miért és hogyan alkalmazunk ellipszistechnikákat.