Anotácia prirodzeného jazyka pre strojové učenie: Sprievodca tvorbou korpusu pre aplikácie

Hodnotenie:   (4,7 z 5)

Anotácia prirodzeného jazyka pre strojové učenie: Sprievodca tvorbou korpusu pre aplikácie (James Pustejovsky)

Recenzie čitateľov

Zhrnutie:

Kniha je vysoko hodnotená pre svoj informatívny a jednoduchý prístup, najmä v kontexte projektov NLP a strojového učenia. Čitatelia ju považujú za vzdelávaciu, užitočnú pri tvorbe aplikácií a za skvelý zdroj informácií s praktickými návodmi na anotáciu a tvorbu korpusov.

Výhody:

Je informatívna a vzdelávacia, ľahko sa s ňou pracuje, poskytuje jasné pokyny k anotácii pre NLP, cenné zdroje pre projekty NLP, je vhodná pre začiatočníkov aj skúsených vývojárov a ponúka nové pohľady.

Nevýhody:

Niektorí čitatelia si nie sú istí jej užitočnosťou pre svoje konkrétne potreby a z jednej recenzie vyplýva, že obsah môže byť desivý kvôli dokumentácii ekologických problémov.

(na základe 8 čitateľských recenzií)

Pôvodný názov:

Natural Language Annotation for Machine Learning: A Guide to Corpus-Building for Applications

Obsah knihy:

Vytvorte si vlastný tréningový korpus prirodzeného jazyka na strojové učenie. Či už pracujete s angličtinou, čínštinou alebo iným prirodzeným jazykom, táto praktická kniha vás prevedie osvedčeným cyklom tvorby anotácií - procesom pridávania metadát do tréningového korpusu, ktorý pomôže algoritmom ML pracovať efektívnejšie. Na to, aby ste mohli začať, nepotrebujete žiadne skúsenosti s programovaním alebo lingvistikou.

Na podrobných príkladoch v každom kroku sa dozviete, ako vám proces vývoja anotácií MATTER pomôže Modelovať, Anotovať, Trainovať, Testovať, Evaluovať a Revidovať váš tréningový korpus. Získate tiež kompletný prehľad reálneho anotačného projektu.

⬤ Definujte si jasný cieľ anotácie pred zhromaždením súboru údajov (korpusu)

⬤ Oboznámite sa s nástrojmi na analýzu jazykového obsahu vášho korpusu.

⬤ Vytvorte si model a špecifikáciu pre svoj anotačný projekt.

⬤ Preskúmajte rôzne formáty anotácií, od základného XML až po Linguistic Annotation Framework.

⬤ Vytvorte zlatý štandardný korpus, ktorý možno použiť na trénovanie a testovanie ML algoritmov.

⬤ Vyberte algoritmy ML, ktoré budú spracovávať vaše anotované údaje.

⬤ Vyhodnoťte výsledky testovania a revidujte svoju anotačnú úlohu.

⬤ Učte sa používať nenáročný softvér na anotovanie textov a posudzovanie anotácií.

Táto kniha je dokonalým doplnkom k publikácii Natural Language Processing with Python od O'Reilly.

Ďalšie údaje o knihe:

ISBN:9781449306663
Autor:
Vydavateľ:
Väzba:Mäkká väzba
Rok vydania:2012
Počet strán:350

Nákup:

Momentálne k dispozícii, na sklade.

Ďalšie knihy autora:

Anotácia prirodzeného jazyka pre strojové učenie: Sprievodca tvorbou korpusu pre aplikácie - Natural...
Vytvorte si vlastný tréningový korpus prirodzeného...
Anotácia prirodzeného jazyka pre strojové učenie: Sprievodca tvorbou korpusu pre aplikácie - Natural Language Annotation for Machine Learning: A Guide to Corpus-Building for Applications
Lexikón - The Lexicon
Čo je to lexikón, čo obsahuje a ako je štruktúrovaný? Aké princípy určujú fungovanie lexikónu ako súčasti gramatiky prirodzeného jazyka? Akú úlohu zohráva...
Lexikón - The Lexicon

Diela autora vydali tieto vydavateľstvá: