Hodnotenie:
Recenzie knihy „Bad Data Handbook“ vyzdvihujú jej silné stránky, ktoré spočívajú v poskytovaní reálnych poznatkov a praktických rád pre prácu so zlými údajmi, ako aj v pútavom formáte esejí. Niektorí recenzenti však považovali názov knihy za zavádzajúci a poukázali na jej nedostatočnú štruktúru vzhľadom na príspevky viacerých autorov.
Výhody:Ponúka cenné postrehy a osvedčené postupy na identifikáciu a opravu zlých údajov.
Nevýhody:Pútavý formát eseje z nej robí príjemné čítanie.
(na základe 15 čitateľských recenzií)
Bad Data Handbook: Cleaning Up the Data So You Can Get Back to Work
Čo sú zlé údaje? Niektorí ľudia to považujú za technický jav, ako sú chýbajúce hodnoty alebo chybné záznamy, ale zlé údaje zahŕňajú oveľa viac. V tejto príručke zhromaždil odborník na údaje Q. Ethan McCallum 19 kolegov zo všetkých kútov dátovej oblasti, aby prezradili, ako sa zotavili z nepríjemných problémov s údajmi.
K zlým údajom vedie mnoho ciest - od mrzutého úložiska cez zlú reprezentáciu až po chybnú politiku. Záver? Zlé údaje sú údaje, ktoré prekážajú. Táto kniha vysvetľuje účinné spôsoby, ako ich obísť.
Medzi mnohými témami, ktorými sa zaoberá, zistíte, ako:
⬤ Vyskúšajte, či sú vaše údaje pripravené na analýzu.
⬤ Zapracovať tabuľkové údaje do použiteľnej podoby.
⬤ Vyriešiť problémy s kódovaním, ktoré sa skrývajú v textových údajoch.
⬤ Vyvinúť úspešné úsilie o web-scraping.
⬤ Používajte nástroje NLP na odhalenie skutočného sentimentu online recenzií.
⬤ Riešenie problémov s cloud computingom, ktoré môžu ovplyvniť vaše analytické úsilie.
⬤ Vyhnite sa zásadám, ktoré vytvárajú prekážky pri analýze údajov.
⬤ Systematický prístup k analýze kvality údajov.