Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 2 hlasoch.
The Unicode cookbook for linguists
Tento text je praktickou príručkou pre lingvistov a programátorov, ktorí pracujú s údajmi vo viacjazyčných počítačových prostrediach. Predstavujeme základné pojmy potrebné na pochopenie fungovania systémov písma a kódovania znakov a ich vzájomnej spolupráce na pomedzí štandardu Unicode a medzinárodnej fonetickej abecedy.
Hoci sa tieto štandardy často stretávajú s nespokojnosťou používateľov, napriek tomu poskytujú výskumníkom jazykov a programátorom konzistentnú výpočtovú architektúru potrebnú na spracovanie, publikovanie a analýzu lexikálnych údajov zo svetových jazykov. Uvádzame preto bežné, ale nie vždy transparentné úskalia, s ktorými sa výskumníci stretávajú pri práci s Unicode a IPA.
Po identifikovaní a prekonaní týchto úskalí spojených so zabezpečením syntaktickej a sémantickej interoperability systémov písma a kódovania znakov (v rozsahu, v akom to je možné) sme vytvorili súbor open-source nástrojov Python a R na prácu s jazykmi, ktoré používajú ortografické profily, ktoré opisujú ortografické konvencie špecifické pre autora alebo dokument. V tejto kuchárskej knihe opisujeme formálnu špecifikáciu ortografických profilov a poskytujeme recepty využívajúce nástroje s otvoreným zdrojovým kódom, aby sme ukázali, ako môžu používatelia segmentovať text, analyzovať ho, identifikovať chyby a transformovať ho do rôznych písomných foriem na účely výskumu porovnávacej lingvistiky.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)