Hodnotenie:
Recenzie na knihu majú zmiešané ohlasy, pričom niektorí používatelia oceňujú jej pokrytie PySparkom, najmä prvých niekoľko kapitol, a jednoduchý prechod pre používateľov Pythonu. V niekoľkých kritikách sa však spomína nedostatočná hĺbka, nízka kvalita písania a nedostatočné podrobnosti, čo vedie k frustrácii z jej celkového prevedenia.
Výhody:⬤ Dobre pokrýva PySpark, najmä v úvodných kapitolách
⬤ užitočné na samoštúdium a prechod z Pythonu na PySpark
⬤ dobré príklady, ktoré poskytuje
⬤ užitočné pre začiatočníkov a stredne pokročilých v oblasti dátovej vedy.
⬤ Zle napísaná s mnohými chybami
⬤ chýbajú podrobné technické informácie a prehľadnosť
⬤ triviálne príklady a nedostatočné vysvetlenie možností
⬤ celkové prevedenie považujem za nevyhovujúce
⬤ značná nespokojnosť s úpravou a kvalitou obsahu.
(na základe 5 čitateľských recenzií)
Applied Data Science Using Pyspark: Learn the End-To-End Predictive Model-Building Cycle
Zoznámte sa s možnosťami PySparku a jeho využitím v oblasti dátovej vedy. Táto komplexná príručka s ručne vybranými príkladmi každodenných prípadov použitia vás prevedie celým cyklom tvorby prediktívnych modelov s najnovšími technikami a trikmi v odbore.
Aplikovaná dátová veda pomocou PySpark je rozdelená do šiestich častí, ktoré vás prevedú celou knihou. V časti 1 začnete so základmi PySparku so zameraním na manipuláciu s údajmi. Zoznámime vás s jazykom a potom na ňom staviame, aby sme vás zoznámili s matematickými funkciami, ktoré sú k dispozícii z police. V časti 2 sa ponoríte do umenia výberu premenných, kde vám ukážeme rôzne techniky výberu dostupné v PySparku. V časti 3 vás vezmeme na cestu algoritmami strojového učenia, implementáciami a technikami jemného ladenia. Budeme hovoriť aj o rôznych validačných metrikách a o tom, ako ich použiť na výber najlepších modelov. V oddieloch 4 a 5 sa venujeme pipeline strojového učenia a rôznym dostupným metódam na operacionalizáciu modelu a jeho obsluhu prostredníctvom Dockeru/rozhrania API. V poslednej časti sa budete zaoberať opakovane použiteľnými objektmi na jednoduché experimentovanie a naučíte sa niekoľko trikov, ktoré vám môžu pomôcť optimalizovať vaše programy a pipeline strojového učenia.
Na konci tejto knihy sa presvedčíte o flexibilite a výhodách PySparku v aplikáciách dátovej vedy. Túto knihu odporúčame tým, ktorí chcú využiť silu paralelných výpočtov pri súčasnej práci s veľkými súbormi údajov.
Čo sa naučíte
⬤ Vytvoriť komplexný prediktívny model.
⬤ Zaviesť techniky výberu viacerých premenných.
⬤ Prevádzkovať modely.
⬤ Zvládnuť viaceré algoritmy a implementácie.
Pre koho je táto kniha určená
Dátovým vedcom a inžinierom strojového učenia a hlbokého učenia, ktorí sa chcú naučiť a používať PySpark na analýzu prúdových dát v reálnom čase.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)