Hodnotenie:
Kniha poskytuje solídny úvod do Apache Spark, najmä pre tých, ktorí už majú skúsenosti s vývojom softvéru. Je dobre štruktúrovaná, pokrýva základné až pokročilé témy, predovšetkým v jazyku Python a venuje sa príslušným funkciám Sparku. Niektorí používatelia však zaznamenali zastarané informácie, najmä v súvislosti s inštaláciami, a nedostatok pokročilých prípadov použitia alebo hĺbkového pokrytia niektorých oblastí.
Výhody:⬤ Poskytuje dobre štruktúrovaný a metodický prístup na rýchle učenie.
⬤ Vhodné pre začiatočníkov a nadšencov Pythonu.
⬤ Pokrýva širokú škálu funkcií Sparku vrátane Spark-SQL a MLlib.
⬤ Prístupná a ľahko stráviteľná, takže je vhodná na rýchle začatie práce so Sparkom.
⬤ Obsahuje odkazy na výskumné práce pre hlbšie pochopenie.
⬤ Niektoré informácie sú zastarané, najmä pokiaľ ide o inštalácie a binárne súbory Hadoop.
⬤ Chýbajú pokročilé prípady použitia a tipy na ladenie výkonu.
⬤ Primárne sa zameriava na Python, s menším dôrazom na Scalu alebo pokročilé témy.
⬤ Zaznamenaných niekoľko pravopisných chýb, čo naznačuje potrebu lepšej korektúry.
⬤ Niektoré kapitoly, ako napríklad Spark Streaming, nemajú dostatočnú hĺbku.
(na základe 23 čitateľských recenzií)
Apache Spark in 24 Hours, Sams Teach Yourself
Apache Spark je rýchly, škálovateľný a flexibilný open source engine na distribuované spracovanie veľkých dát a je jedným z najaktívnejších open source projektov na spracovanie veľkých dát. Kniha Sams Teach Yourself Apache Spark in 24 Hours vám v 24 lekciách trvajúcich maximálne jednu hodinu pomôže vytvoriť praktické riešenia na spracovanie veľkých dát, ktoré využívajú úžasnú rýchlosť, škálovateľnosť, jednoduchosť a všestrannosť Sparku.
Táto kniha vám vďaka priamočiaremu prístupu krok za krokom ukáže, ako nasadiť, naprogramovať, optimalizovať, spravovať, integrovať a rozširovať Spark - teraz a na ďalšie roky. Zistíte, ako vytvoriť výkonné riešenia zahŕňajúce cloud computing, spracovanie dátových tokov v reálnom čase, strojové učenie a ďalšie. Každá lekcia nadväzuje na to, čo ste sa už naučili, a poskytuje vám pevný základ pre úspech v reálnom svete.
Bez ohľadu na to, či ste dátový analytik, dátový inžinier, dátový vedec alebo správca dát, štúdium Sparku vám pomôže napredovať v kariére alebo začať novú kariéru v rýchlo sa rozvíjajúcej oblasti Big Data.
Naučte sa, ako.
- Zistiť, čo Apache Spark robí a ako zapadá do prostredia Big Data.
- Nasadiť a spustiť Spark lokálne alebo v cloude.
- Komunikovať so Sparkom zo shellu.
- Čo najlepšie využívať architektúru Spark Cluster.
- Vyvíjajte aplikácie Spark pomocou jazyka Scala a funkčného jazyka Python.
- Programovanie s API Spark vrátane transformácií a akcií.
- Uplatňovať praktické prístupy dátového inžinierstva/analýzy určené pre Spark.
- Používať odolné distribuované súbory údajov (RDD) na ukladanie do vyrovnávacej pamäte, perzistenciu a výstup.
- Optimalizovať výkon riešenia Spark.
- Používajte Spark s SQL (prostredníctvom Spark SQL) a s NoSQL (prostredníctvom Cassandry).
- Využívajte najmodernejšie techniky funkčného programovania.
- Rozšírte Spark o streamovanie, R a Sparkling Water.
- Začnite budovať aplikácie na strojové učenie a spracovanie grafov založené na technológii Spark.
- Preskúmajte pokročilé technológie zasielania správ vrátane Kafky.
- Prezrite si a pripravte sa na ďalšiu generáciu inovácií Sparku.
Návody vás prevedú bežnými otázkami, problémami a úlohami.
Otázky a odpovede, kvízy a cvičenia budujú a testujú vaše znalosti.
Tipy Did You Know? ponúkajú zasvätené rady a skratky.
A upozornenia Pozor, pomôžu vám vyhnúť sa nástrahám. Po dokončení budete pohodlne používať Apache Spark na riešenie širokého spektra problémov s veľkými dátami.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)