Hodnotenie:
Kniha je vysoko hodnotená pre svoj informatívny a jednoduchý prístup, najmä v kontexte projektov NLP a strojového učenia. Čitatelia ju považujú za vzdelávaciu, užitočnú pri tvorbe aplikácií a za skvelý zdroj informácií s praktickými návodmi na anotáciu a tvorbu korpusov.
Výhody:Je informatívna a vzdelávacia, ľahko sa s ňou pracuje, poskytuje jasné pokyny k anotácii pre NLP, cenné zdroje pre projekty NLP, je vhodná pre začiatočníkov aj skúsených vývojárov a ponúka nové pohľady.
Nevýhody:Niektorí čitatelia si nie sú istí jej užitočnosťou pre svoje konkrétne potreby a z jednej recenzie vyplýva, že obsah môže byť desivý kvôli dokumentácii ekologických problémov.
(na základe 8 čitateľských recenzií)
Natural Language Annotation for Machine Learning: A Guide to Corpus-Building for Applications
Vytvorte si vlastný tréningový korpus prirodzeného jazyka na strojové učenie. Či už pracujete s angličtinou, čínštinou alebo iným prirodzeným jazykom, táto praktická kniha vás prevedie osvedčeným cyklom tvorby anotácií - procesom pridávania metadát do tréningového korpusu, ktorý pomôže algoritmom ML pracovať efektívnejšie. Na to, aby ste mohli začať, nepotrebujete žiadne skúsenosti s programovaním alebo lingvistikou.
Na podrobných príkladoch v každom kroku sa dozviete, ako vám proces vývoja anotácií MATTER pomôže Modelovať, Anotovať, Trainovať, Testovať, Evaluovať a Revidovať váš tréningový korpus. Získate tiež kompletný prehľad reálneho anotačného projektu.
⬤ Definujte si jasný cieľ anotácie pred zhromaždením súboru údajov (korpusu)
⬤ Oboznámite sa s nástrojmi na analýzu jazykového obsahu vášho korpusu.
⬤ Vytvorte si model a špecifikáciu pre svoj anotačný projekt.
⬤ Preskúmajte rôzne formáty anotácií, od základného XML až po Linguistic Annotation Framework.
⬤ Vytvorte zlatý štandardný korpus, ktorý možno použiť na trénovanie a testovanie ML algoritmov.
⬤ Vyberte algoritmy ML, ktoré budú spracovávať vaše anotované údaje.
⬤ Vyhodnoťte výsledky testovania a revidujte svoju anotačnú úlohu.
⬤ Učte sa používať nenáročný softvér na anotovanie textov a posudzovanie anotácií.
Táto kniha je dokonalým doplnkom k publikácii Natural Language Processing with Python od O'Reilly.