Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 2 hlasoch.
The Unicode Cookbook for Linguists
Tento text je praktickou príručkou pre lingvistov a programátorov, ktorí pracujú s údajmi vo viacjazyčných počítačových prostrediach.
Predstavujeme základné pojmy potrebné na pochopenie fungovania systémov písma a kódovania znakov a ich vzájomnej spolupráce na pomedzí štandardu Unicode a medzinárodnej fonetickej abecedy. Hoci sa tieto štandardy často stretávajú s nespokojnosťou používateľov, napriek tomu poskytujú výskumníkom jazykov a programátorom konzistentnú výpočtovú architektúru potrebnú na spracovanie, publikovanie a analýzu lexikálnych údajov zo svetových jazykov.
Uvádzame preto bežné, ale nie vždy transparentné úskalia, s ktorými sa výskumníci stretávajú pri práci s Unicode a IPA. Po identifikovaní a prekonaní týchto úskalí spojených so zabezpečením syntaktickej a sémantickej interoperability systémov písma a kódovania znakov (v rozsahu, v akom to je možné) sme vytvorili súbor open-source nástrojov Python a R na prácu s jazykmi, ktoré používajú ortografické profily, ktoré opisujú ortografické konvencie špecifické pre autora alebo dokument. V tejto kuchárskej knihe opisujeme formálnu špecifikáciu ortografických profilov a poskytujeme recepty využívajúce nástroje s otvoreným zdrojovým kódom, aby sme ukázali, ako môžu používatelia segmentovať text, analyzovať ho, identifikovať chyby a transformovať ho do rôznych písomných foriem na účely výskumu porovnávacej lingvistiky.
Toto dielo vydalo vydavateľstvo Saint Philip Street Press na základe licencie Creative Commons umožňujúcej komerčné použitie. Všetky práva, ktoré licencia diela neudeľuje, si ponecháva autor alebo autori.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)