SHALLOW DISCOURSE PARSING FOR GERMAN
Za posledných niekoľko desaťročí došlo k pôsobivému zlepšeniu vo viacerých oblastiach spracovania prirodzeného jazyka. Napriek tomu je stále náročné prinútiť počítač, aby pochopil diskurz výpovedí v texte.
Existuje niekoľko rôznych teórií, ktorých cieľom je opísať a analyzovať koherentnú štruktúru dobre napísaného textu, ale s rôznym stupňom použiteľnosti a realizovateľnosti pre praktické využitie. Táto kniha sa zaoberá plytkým rozborom diskurzu podľa paradigmy Penn Discourse TreeBank, korpusu, ktorý obsahuje viac ako 1 milión slov anotovaných pre vzťahy diskurzu. Pokiaľ ide o spracovanie diskurzu, každý iný jazyk ako angličtina sa musí považovať za jazyk s nízkym zdrojom.
Táto kniha sa zaoberá spracovaním diskurzu v nemčine. Obmedzená dostupnosť anotovaných údajov pre nemčinu znamená, že aj potenciál moderných metód založených na hlbokej analýze, ktoré sa opierajú o takéto údaje, je obmedzený.
V tejto knihe sa skúma, do akej miery možno kombinovať strojové učenie a novšie metódy založené na hĺbkovom učení s tradičným lingvistickým príznakovým inžinierstvom s cieľom zlepšiť výkonnosť úlohy rozboru diskurzu. Koncový plytký parser diskurzu pre nemčinu vyvinutý na účely tejto knihy je otvorený a dostupný online. Pracovalo sa aj na niekoľkých spojovacích lexikónoch v rôznych jazykoch.
Diskutuje sa o stratégiách tvorby alebo ďalšieho rozvoja takýchto lexikónov pre daný jazyk, ako aj o návrhoch, ako ďalej zvýšiť ich užitočnosť pre plytký rozbor diskurzu. Kniha bude zaujímavá pre všetkých, ktorých práca sa týka spracovania prirodzeného jazyka, najmä v iných jazykoch ako angličtina.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)