Az előadás kulcsszavai: írásbeliség, grafonyelvi
technikák, Goody-lista, médiumspecifikus tudásreprezentáció, gépi
szövegfeldolgozás, reguláris kifejezések, jogszabályalkotási munka
számítógépes támogatása
Az a felismerés, hogy a médiumok sajátosságai specifikus
- vagyis az adott médiumra jellemző - tudásreprezentációkat hoznak
létre, nem új keletű. Az írott szöveg pl. használ olyan megoldásokat
- Jack Goody kifejezését használva: grafonyelvi technikákat -, amelyek
a szöveg rögzítettsége és a vizuális karaktere nyomán jönnek létre,
és amelyek a szóbeli átadásban nem alkalmazhatók. Ilyenek a listák,
a táblázatok és más szövegrendezési eljárások. Kutatásunkban jogszabályszövegeket
vizsgálunk. Ezek a szövegek a mindennapi nyelvhasználathoz képest
jóval formalizáltabbak, formai és tagolási szabályait jogszabály
rögzíti (61/2009. (XII. 14.) IRM rendelet). Az általunk vizsgált
szövegek számos grafonyelvi megoldást használnak, pl. az olyan elliptikus
listaelemekből álló felsorolásokat, amelyek csak más szerkezeti
egységekkel együtt alkothatnak teljes mondatot. Ezeket a listákat
Goody-listáknak neveztük el, és olyan nyelvtechnológiai eljárásokat
dolgoztunk ki, amelyek segítéségével Goody-listákat automatizált
módon azonosítunk és kategorizálunk. Az elemzéshez jogszabályokból
adatbázist hoztunk létre úgy, hogy egy jogszabályi szerkezeti egység
alkosson egy rekordot. Az így kialakított tízezer rekordos korpuszunkban
előforduló háromezer Goody-listás elliptikus rekordból kétezerkétszáz
teljes, szabályos jogi mondat állítható elő. Eredményeink egyfelől
jól alkalmazhatók jogszabályi szövegek gépi kezelésében (a jogszabályszövegek
propoziciós struktúrájának feltárásában), másfelől fontos felismeréseket
nyújtanak a médiaspecifikus tudásreprezentáció problémájához. Az
elliptikus Goody-listák sajátosságainak bemutatásához szükséges
elemeznünk azt is, hogy - akár az írásos, akár a szóbeli - szövegeinkben
miért és hogyan alkalmazunk ellipszistechnikákat.
|