Hodnotenie:
Kniha o Apache Spark (primárne zameraná na PySpark) získala rôzne recenzie, ktoré vyzdvihujú jej praktický prístup, podrobné vysvetlenia a rozsiahle príklady v jazykoch Scala aj Python. Čelí však aj kritike za organizáciu, presnosť kódu a problémy s formátovaním pri čítaní na niektorých zariadeniach.
Výhody:⬤ Praktický prístup k učeniu
⬤ komplexné pokrytie konceptov Sparku
⬤ podrobné príklady kódu v jazykoch Scala a Python
⬤ obsahuje časti o ML
⬤ usporiadaný materiál na pochopenie architektúry Sparku
⬤ vhodný pre študentov prechádzajúcich z iných programovacích jazykov
⬤ užitočný ako jediný zdroj pre Spark v produkcii.
⬤ Niektoré príklady kódu sú nesprávne alebo si vyžadujú úpravu
⬤ organizácia môže byť roztrieštená
⬤ problémy s formátovaním na digitálnych platformách (napr. Kindle)
⬤ stránky môžu mať zlú kvalitu tlače
⬤ niektorí ju považujú za opakujúcu sa
⬤ nemusí poskytnúť okamžité využiteľné znalosti pre všetkých čitateľov.
(na základe 71 čitateľských recenzií)
Spark: The Definitive Guide: Big Data Processing Made Simple
Naučte sa používať, nasadzovať a udržiavať Apache Spark s touto komplexnou príručkou, ktorú napísali tvorcovia tohto open-source clusterového výpočtového rámca. S dôrazom na vylepšenia a nové funkcie v Sparku 2. 0, autori Bill Chambers a Matei Zaharia rozdelili témy Sparku do samostatných častí, z ktorých každá má jedinečný cieľ.
Preskúmate základné operácie a bežné funkcie štruktúrovaných rozhraní API Sparku, ako aj štruktúrovaný streaming, nové vysokoúrovňové rozhranie API na vytváranie end-to-end streamovacích aplikácií. Vývojári a správcovia systémov sa naučia základy monitorovania, ladenia a ladenia Sparku a preskúmajú techniky strojového učenia a scenáre využívania MLlib, škálovateľnej knižnice strojového učenia Sparku.
⬤ Získajte jemný prehľad o veľkých dátach a Sparku.
⬤ Zoznámite sa s DataFrames, SQL a Datasets - základnými API Sparku - na praktických príkladoch.
⬤ Ponorte sa do nízkoúrovňových API Sparku, RDD a vykonávania SQL a DataFrames.
⬤ Poznajte, ako Spark beží na klastri.
⬤ Debugovať, monitorovať a ladiť klastre a aplikácie Spark.
⬤ Oboznámte sa s výkonom štruktúrovaného streamingu Spark a MLlib pre úlohy strojového učenia.
⬤ Preskúmajte širší ekosystém Spark vrátane SparkR a Graph Analysis.
⬤ Preskúmajte nasadenie Sparku vrátane pokrytia Sparku v cloude.