Hodnotenie:
Kniha 'Python Natural Language Processing Cookbook' od Zhenya Antića je všeobecne dobre prijímaná pre svoj praktický prístup k NLP, ktorý poskytuje užitočné recepty na rôzne úlohy NLP a pokrýva základné aj pokročilé témy. Čelí však kritike za početné chyby v kódovaní a nedôslednosti, ktoré niektorým čitateľom bránia v učení.
Výhody:⬤ Jednoduché čítanie s jasnými príkladmi.
⬤ Užitočné pre začiatočníkov aj pokročilých.
⬤ Obsahuje praktické recepty na úlohy NLP krok za krokom.
⬤ Dobre pokrýva moderné koncepty NLP vrátane používania nástrojov ako Rasa a BERT.
⬤ Repozitár GitHub ponúka porovnávanie verzií balíkov.
⬤ Pomáha pri vytváraní projektov od začiatku.
⬤ V príkladoch sa nachádza značný počet chýb v kódovaní.
⬤ Niektorí čitatelia mali problémy s prístupom k zdrojom údajov.
⬤ Minimálne vysvetlenia zložitých pojmov a terminológie.
⬤ Niektorí mali pocit, že prechody medzi rôznymi knižnicami neboli dobre vysvetlené.
⬤ Vyžaduje od čitateľov predchádzajúcu znalosť určitého žargónu, takže je menej vhodná pre začiatočníkov, ako sa zamýšľalo.
(na základe 15 čitateľských recenzií)
Python Natural Language Processing Cookbook: Over 50 recipes to understand, analyze, and generate text for implementing language processing tasks
Zoznámte sa s riešením reálnych problémov NLP, ako je rozbor závislostí, extrakcia informácií, modelovanie tém a vizualizácia textových údajov
Kľúčové vlastnosti:
⬤ Analyzujte rôzne zložité texty pomocou populárnych balíkov jazyka Python, ako sú NLTK, spaCy, sklearn a gensim.
⬤ Vykonávanie bežných aj menej bežných úloh lingvistického spracovania pomocou knižníc jazyka Python.
⬤ Prekonajte bežné výzvy, ktorým čelíte pri implementácii pipeline NLP.
Popis knihy:
Python je najpoužívanejším jazykom na spracovanie prirodzeného jazyka (NLP) vďaka rozsiahlym nástrojom a knižniciam na analýzu textu a získavanie počítačovo využiteľných údajov. Táto kniha vás prevedie celým radom techník na spracovanie textu, od základov, ako je rozbor častí reči, až po zložité témy, ako je modelovanie tém, klasifikácia textu a vizualizácia.
Kniha začína prehľadom NLP a predstavuje recepty na rozdelenie textu na vety, stemming a lemmatizáciu, odstraňovanie stopslov a označovanie častí reči, ktoré vám pomôžu pripraviť vaše údaje. Potom sa naučíte spôsoby extrakcie a reprezentácie gramatických informácií, ako je rozbor závislostí a riešenie anafor, objavíte rôzne spôsoby reprezentácie sémantiky pomocou bag-of-words, TF-IDF, word embeddings a BERT a rozviniete zručnosti pri klasifikácii textu pomocou kľúčových slov, SVM, LSTM a ďalších techník. Ako budete postupovať, uvidíte aj to, ako extrahovať informácie z textu, implementovať techniky modelovania tém bez dohľadu a s dohľadom a vykonávať modelovanie tém krátkych textov, ako sú tweety. Okrem toho vám kniha ukáže, ako vyvíjať chatboty pomocou NLTK a Rasa a vizualizovať textové údaje.
Na konci tejto knihy o NLP získate zručnosti na používanie výkonného súboru nástrojov na spracovanie textu.
Čo sa naučíte:
⬤ Zoznámite sa so základnými a pokročilými technikami NLP v jazyku Python.
⬤ Zobrazovať gramatické informácie v texte pomocou spaCy a sémantické informácie pomocou bag-of-words, TF-IDF a word embeddings.
⬤ Vykonajte klasifikáciu textu pomocou rôznych metód vrátane SVM a LSTM.
⬤ Preskúmajte rôzne techniky modelovania tém, ako napríklad K-means, LDA, NMF a BERT.
⬤ Pracovať s technikami vizualizácie, ako sú NER a mraky slov pre rôzne nástroje NLP.
⬤ Zostavte základného chatbota pomocou NLTK a Rasa.
⬤ Vyberať informácie z textu pomocou techník regulárnych výrazov a štatistických nástrojov a nástrojov hlbokého učenia.
Pre koho je táto kniha určená:
Táto kniha je určená pre dátových vedcov a profesionálov, ktorí sa chcú naučiť pracovať s textom. Stredne pokročilá znalosť jazyka Python vám pomôže vyťažiť z tejto knihy maximum. Ak ste odborník na NLP, táto kniha vám poslúži ako referencia na kód pri práci na vašich projektoch.