Vysoko výkonná iskra: Najlepšie postupy pre optimalizáciu Apache Spark

Vysoký výkon Spark: Najlepšie postupy pre škálovanie a optimalizáciu Apache Spark (Holden Karau)

Recenzie čitateľov

Zhrnutie:

Kniha „High Performance Spark“ ponúka podrobný prehľad písania efektívneho kódu Spark, ktorý je vhodný pre profesionálov s predchádzajúcimi znalosťami jazyka Scala a Spark. Zameriava sa na optimalizáciu výkonu a poskytuje dôkladné príklady kódu, najmä v jazyku Scala. Zatiaľ čo niektorí používatelia ju považovali za dobre štruktúrovaný a informatívny zdroj, iní kritizovali jej prístupnosť pre začiatočníkov a veľkú závislosť od jazyka Scala.

Výhody:

⬤ Komplexný sprievodca písaním vysoko výkonného kódu Spark.
⬤ Podrobné vysvetlenia pokročilých konceptov a optimalizačných techník.
⬤ Dobre štruktúrovaný s dobrým pomerom teórie a praktických aplikácií.
⬤ Bohatá na príklady kódu, ktoré zlepšujú pochopenie, najmä pre tých, ktorí poznajú jazyk Scala.
⬤ Prehľadná prezentácia, jednoduchosť a užitočné diagramy.

Nevýhody:

⬤ Nevhodné pre začiatočníkov; vyžaduje predchádzajúce znalosti jazyka Spark a Scala.
⬤ Veľké zameranie na jazyk Scala môže odradiť používateľov, ktorí tento jazyk nepoznajú.
⬤ Niektorí používatelia mali pocit, že je príliš hustá a náročná bez praktického prostredia Sparku.
⬤ Obmedzené pokrytie niektorých tém, ako napríklad Spark streaming.
⬤ Niektorí ju považovali za nudnú kvôli nadmernému množstvu príkladov kódovania.

(na základe 27 čitateľských recenzií)

Pôvodný názov:

High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark

Obsah knihy:

Apache Spark je úžasný, keď všetko klape. Ak ste však nezaznamenali očakávané zlepšenie výkonu alebo sa ešte stále necítite dostatočne sebavedomo, aby ste Spark používali v produkcii, táto praktická kniha je určená práve vám. Autori Holden Karau a Rachel Warren ukazujú optimalizácie výkonu, ktoré pomôžu vašim dotazom v Sparku bežať rýchlejšie a zvládať väčšie objemy dát pri použití menšieho množstva zdrojov.

Táto kniha je ideálna pre softvérových inžinierov, dátových inžinierov, vývojárov a správcov systémov pracujúcich s rozsiahlymi dátovými aplikáciami a opisuje techniky, ktoré môžu znížiť náklady na dátovú infraštruktúru a znížiť počet hodín strávených vývojármi. Nielenže získate komplexnejšie znalosti o Sparku, ale naučíte sa aj to, ako ho spevniť.

Vďaka tejto knihe preskúmate:

⬤ Ako nové rozhrania Spark SQL zvyšujú výkonnosť oproti dátovej štruktúre RDD jazyka SQL.

⬤ Výber medzi spájaním údajov v jadre Spark a Spark SQL.

⬤ Techniky, ako čo najlepšie využiť štandardné transformácie RDD.

⬤ Ako obísť problémy s výkonom v paradigme párov kľúč/hodnota v Sparku.

⬤ Písanie vysoko výkonného kódu Spark bez jazyka Scala alebo JVM.

⬤ Ako testovať funkčnosť a výkon pri použití navrhovaných vylepšení.

⬤ Používanie knižníc Spark MLlib a Spark ML pre strojové učenie.

⬤ Spartovacie komponenty Sparku a externé komunitné balíky.

Ďalšie údaje o knihe:

ISBN:	9781491943205
Autor:	Holden Karau
Vydavateľ:	Oreilly Media
Väzba:	Mäkká väzba
Rok vydania:	2017
Počet strán:	358

Nákup:

Momentálne k dispozícii, na sklade.

Vysoký výkon Spark: Najlepšie postupy pre škálovanie a optimalizáciu Apache Spark

Recenzie čitateľov

Pôvodný názov:

Obsah knihy:

Ďalšie údaje o knihe:

Nákup:

Ďalšie knihy autora:

Diela autora vydali tieto vydavateľstvá: