Hodnotenie:
Kniha „High Performance Spark“ ponúka podrobný prehľad písania efektívneho kódu Spark, ktorý je vhodný pre profesionálov s predchádzajúcimi znalosťami jazyka Scala a Spark. Zameriava sa na optimalizáciu výkonu a poskytuje dôkladné príklady kódu, najmä v jazyku Scala. Zatiaľ čo niektorí používatelia ju považovali za dobre štruktúrovaný a informatívny zdroj, iní kritizovali jej prístupnosť pre začiatočníkov a veľkú závislosť od jazyka Scala.
Výhody:⬤ Komplexný sprievodca písaním vysoko výkonného kódu Spark.
⬤ Podrobné vysvetlenia pokročilých konceptov a optimalizačných techník.
⬤ Dobre štruktúrovaný s dobrým pomerom teórie a praktických aplikácií.
⬤ Bohatá na príklady kódu, ktoré zlepšujú pochopenie, najmä pre tých, ktorí poznajú jazyk Scala.
⬤ Prehľadná prezentácia, jednoduchosť a užitočné diagramy.
⬤ Nevhodné pre začiatočníkov; vyžaduje predchádzajúce znalosti jazyka Spark a Scala.
⬤ Veľké zameranie na jazyk Scala môže odradiť používateľov, ktorí tento jazyk nepoznajú.
⬤ Niektorí používatelia mali pocit, že je príliš hustá a náročná bez praktického prostredia Sparku.
⬤ Obmedzené pokrytie niektorých tém, ako napríklad Spark streaming.
⬤ Niektorí ju považovali za nudnú kvôli nadmernému množstvu príkladov kódovania.
(na základe 27 čitateľských recenzií)
High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Apache Spark je úžasný, keď všetko klape. Ak ste však nezaznamenali očakávané zlepšenie výkonu alebo sa ešte stále necítite dostatočne sebavedomo, aby ste Spark používali v produkcii, táto praktická kniha je určená práve vám. Autori Holden Karau a Rachel Warren ukazujú optimalizácie výkonu, ktoré pomôžu vašim dotazom v Sparku bežať rýchlejšie a zvládať väčšie objemy dát pri použití menšieho množstva zdrojov.
Táto kniha je ideálna pre softvérových inžinierov, dátových inžinierov, vývojárov a správcov systémov pracujúcich s rozsiahlymi dátovými aplikáciami a opisuje techniky, ktoré môžu znížiť náklady na dátovú infraštruktúru a znížiť počet hodín strávených vývojármi. Nielenže získate komplexnejšie znalosti o Sparku, ale naučíte sa aj to, ako ho spevniť.
Vďaka tejto knihe preskúmate:
⬤ Ako nové rozhrania Spark SQL zvyšujú výkonnosť oproti dátovej štruktúre RDD jazyka SQL.
⬤ Výber medzi spájaním údajov v jadre Spark a Spark SQL.
⬤ Techniky, ako čo najlepšie využiť štandardné transformácie RDD.
⬤ Ako obísť problémy s výkonom v paradigme párov kľúč/hodnota v Sparku.
⬤ Písanie vysoko výkonného kódu Spark bez jazyka Scala alebo JVM.
⬤ Ako testovať funkčnosť a výkon pri použití navrhovaných vylepšení.
⬤ Používanie knižníc Spark MLlib a Spark ML pre strojové učenie.
⬤ Spartovacie komponenty Sparku a externé komunitné balíky.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)