Hodnotenie:
Celkovo sa kniha považuje za vynikajúci zdroj informácií o čistení údajov pomocou jazyka Python, ktorý ponúka praktické rady, jasné vysvetlenia a množstvo príkladov kódovania. Hoci slúži ako komplexný úvod pre začiatočníkov aj ako užitočná referencia pre skúsených dátových vedcov, niektorí recenzenti upozornili na oblasti, ktoré je potrebné zlepšiť, najmä pokiaľ ide o formátovanie kódu a zahrnutie grafiky.
Výhody:Kniha je veľmi praktická, poskytuje jasné a štruktúrované vysvetlenia, množstvo príkladov a množstvo techník na čistenie, manipuláciu a vizualizáciu údajov. Slúži ako vynikajúci základný materiál pre tých, ktorí s dátovou vedou alebo umelou inteligenciou začínajú, a oceňuje sa najmä pre jej prehľad, organizáciu a použiteľnosť ako rýchla referenčná príručka. Recenzenti ocenili dôraz na pochopenie zdôvodnenia úloh spracovania údajov, čo zlepšuje učenie.
Nevýhody:Niektorí recenzenti poukázali na problémy, ako sú zle formátované príklady kódu, ktoré sa ťažko čítajú, minimálne využitie grafiky v rozpore s typickou prieskumnou analýzou údajov a potreba komplexnejších tém, ako je čistenie časových radov údajov. Niekoľko z nich poznamenalo, že hoci slúži ako solídny východiskový bod, nemusí do hĺbky pokrývať všetky pokročilé témy.
(na základe 28 čitateľských recenzií)
Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract key insights
Zistite, ako podrobne opísať svoje údaje, identifikovať problémy s údajmi a zistiť, ako ich riešiť pomocou bežne používaných techník a tipov a trikov
Kľúčové vlastnosti
⬤ Získajte prehľad o rôznych technikách čistenia údajov, ktoré vám pomôžu odhaliť kľúčové poznatky.
⬤ Manipulujte s údajmi rôznej zložitosti a formujte ich do správnej podoby podľa potrieb vášho podniku.
⬤ Čistite, monitorujte a overujte veľké objemy údajov s cieľom diagnostikovať problémy pred prechodom na analýzu údajov.
Popis knihy
Získanie čistých údajov na odhalenie poznatkov je veľmi dôležité, pretože priamy skok do analýzy údajov bez ich správneho vyčistenia môže viesť k nesprávnym výsledkom. Táto kniha vám ukáže nástroje a techniky, ktoré môžete použiť na čistenie a spracovanie údajov pomocou jazyka Python. Začnete oboznámením sa s tvarom údajov pomocou postupov, ktoré možno bežne nasadiť pri väčšine zdrojov údajov. Potom vás kniha naučí, ako s údajmi manipulovať, aby ste ich dostali do užitočnej podoby. Naučíte sa tiež, ako filtrovať a sumarizovať údaje, aby ste získali prehľad a lepšie pochopili, čo má zmysel a čo nie, spolu s odhalením, ako pracovať s údajmi na riešenie zistených problémov. Ďalej budete vykonávať kľúčové úlohy, ako je spracovanie chýbajúcich hodnôt, overovanie chýb, odstraňovanie duplicitných údajov, monitorovanie veľkých objemov údajov a spracovanie odľahlých hodnôt a neplatných dátumov. Ďalej sa budete venovať receptom na používanie kontrolovaného učenia a analýzy Naive Bayes na identifikáciu neočakávaných hodnôt a klasifikačných chýb a vytváranie vizualizácií pre prieskumnú analýzu údajov (EDA) na vizualizáciu neočakávaných hodnôt. Nakoniec vytvoríte funkcie a triedy, ktoré môžete opätovne použiť bez úprav, keď budete mať nové údaje.
Na konci tejto knihy o jazyku Python budete mať všetky kľúčové zručnosti, ktoré potrebujete na čistenie údajov a diagnostiku problémov v nich.
Čo sa naučíte
⬤ Zistíte, ako čítať a analyzovať údaje z rôznych zdrojov.
⬤ Vytvárať súhrny atribútov dátových rámcov, stĺpcov a riadkov.
⬤ Filtrovať údaje a vyberať stĺpce záujmu, ktoré spĺňajú dané kritériá.
⬤ Riešenie problémov s neprehľadnými údajmi vrátane práce s dátumami a chýbajúcimi hodnotami.
⬤ Zvýšte svoju produktivitu v jazyku Python pandas pomocou reťazenia metód.
⬤ Používajte vizualizácie na získanie ďalších informácií a identifikáciu potenciálnych problémov s údajmi.
⬤ Zlepšite svoju schopnosť dozvedieť sa, čo sa deje vo vašich údajoch.
⬤ Vytvárajte užívateľsky definované funkcie a triedy na automatizáciu čistenia údajov.
Pre koho je táto kniha určená
Táto kniha je určená všetkým, ktorí hľadajú spôsoby, ako spracovať chaotické, duplicitné a nekvalitné údaje pomocou rôznych nástrojov a techník jazyka Python. Kniha využíva prístup založený na receptoch, ktoré vám pomôžu naučiť sa čistiť a spravovať údaje. Na to, aby ste z knihy vyťažili čo najviac, vám stačí praktická znalosť programovania v jazyku Python.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)