Hodnotenie:
Kniha je oceňovaná pre svoj jasný a hovorový štýl písania, komplexné pokrytie konceptov NLP a dátovej vedy a jej vzdelávaciu hodnotu. Trpí však zastaranými príkladmi kódu, opakujúcim sa obsahom, tlačovými chybami a nejasnosťou v niektorých oblastiach, čo znižuje jej celkovú účinnosť ako učebnice.
Výhody:⬤ Jasné a hovorové písanie
⬤ Komplexný obsah o NLP a vede o údajoch
⬤ Mnoho príkladov kódu
⬤ Odporúčame nadšencom textovej analýzy
⬤ Dobré vysvetlenia a zrozumiteľný jazyk.
⬤ Zastarané príklady kódu, ktoré často nefungujú
⬤ Opakujúci sa obsah naprieč kapitolami
⬤ Chyby v tlači a šedá grafika
⬤ Niektorí čitatelia ju považovali za nudnú a príliš mnohomluvnú.
(na základe 11 čitateľských recenzií)
Text Analytics with Python: A Practitioner's Guide to Natural Language Processing
Využite spracovanie prirodzeného jazyka (NLP) v jazyku Python a naučte sa, ako si vytvoriť vlastné robustné prostredie na vykonávanie textovej analýzy. Toto druhé vydanie prešlo zásadnou modernizáciou a prináša niekoľko významných zmien a nových tém na základe najnovších trendov v oblasti NLP.
Uvidíte, ako používať najnovšie najmodernejšie rámce v NLP v spojení s modelmi strojového učenia a hlbokého učenia na kontrolovanú analýzu sentimentu s využitím jazyka Python na riešenie skutočných prípadových štúdií. Začnite prehľadom základov jazyka Python pre NLP na reťazcoch a textových údajoch a prejdite na metódy technickej reprezentácie pre textové údaje vrátane tradičných štatistických modelov aj novších modelov vkladania založených na hlbokom učení. Rozoberajú sa aj vylepšené techniky a nové metódy okolo rozboru a spracovania textu.
Sumarizácia textu a tematické modely boli prepracované, takže kniha ukazuje, ako vytvárať, ladiť a interpretovať tematické modely v kontexte záujmového súboru údajov o príspevkoch z konferencie NIPS. Okrem toho sa kniha zaoberá technikami podobnosti textu s reálnym príkladom filmových odporúčaní spolu s analýzou sentimentu pomocou kontrolovaných a nekontrolovaných techník.
Je tu aj kapitola venovaná sémantickej analýze, v ktorej sa dozviete, ako si od základu vytvoriť vlastný systém rozpoznávania pomenovaných entít (NER). Hoci celková štruktúra knihy zostáva rovnaká, celá kódová základňa, moduly a kapitoly boli aktualizované na najnovšiu verziu jazyka Python 3. x.
Čo sa naučíte
- Pochopiť NLP a syntax, sémantiku a štruktúru textu- Objaviť čistenie textu a príznakové inžinierstvo- Preskúmať klasifikáciu textu a zhlukovanie textu- Posúdiť sumarizáciu textu a tematické modely- Študovať hlboké učenie pre NLP.
Pre koho je táto kniha určená
IT profesionálom, dátovým analytikom, vývojárom, lingvistickým expertom, dátovým vedcom a inžinierom a v podstate všetkým, ktorí sa zaujímajú o lingvistiku, analytiku a generovanie poznatkov z textových údajov.