Hodnotenie:
Kniha je komplexnou referenciou o metódach dolovania údajov, ktorej autorom je známy tím zo Stanfordu. Hoci je chválená pre svoju zrozumiteľnosť a pokrytie teórie aj praktických aplikácií, niektorí čitatelia považujú jazyk za zložitý a vysvetlenia niektorých algoritmov za nedostatočné.
Výhody:Jasne a stručne napísané, pokrýva teóriu a praktické aspekty dolovania údajov, vhodné pre pokročilých študentov a začínajúcich absolventov vysokých škôl, silná referencia pre populárne algoritmy.
Nevýhody:Ťažký jazyk v niektorých častiach, nedbalo napísané časti, neúplné pokrytie niektorých algoritmov, nevhodné ako primárny študijný zdroj.
(na základe 3 čitateľských recenzií)
Mining of Massive Datasets
Táto kniha, napísaná poprednými autoritami v oblasti databázových a webových technológií, je nevyhnutným čítaním pre študentov aj odborníkov z praxe. Popularita webu a internetového obchodu poskytuje množstvo mimoriadne veľkých súborov údajov, z ktorých možno získavať informácie pomocou dolovania údajov.
Táto kniha sa zameriava na praktické algoritmy, ktoré boli použité na riešenie kľúčových problémov v oblasti dolovania údajov a ktoré možno úspešne aplikovať aj na najväčšie súbory údajov. Začína sa diskusiou o rámci MapReduce, ktorý je dôležitým nástrojom na automatickú paralelizáciu algoritmov. Autori vysvetľujú triky lokálne citlivého hashovania a algoritmov prúdového spracovania na dolovanie údajov, ktoré prichádzajú príliš rýchlo na vyčerpávajúce spracovanie.
Ďalšie kapitoly sa zaoberajú myšlienkou PageRank a súvisiacimi trikmi na organizáciu webu, problémami hľadania častých množín položiek a zhlukovaním. Toto tretie vydanie obsahuje nové a rozšírené pokrytie rozhodovacích stromov, hlbokého učenia a dolovania grafov sociálnych sietí.