Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 5 hlasoch.
Beginning Apache Spark 2: With Resilient Distributed Datasets, Spark Sql, Structured Streaming and Spark Machine Learning Library
Vývoj aplikácií pre prostredie veľkých dát pomocou Sparku a Hadoopu. Táto kniha tiež vysvetľuje úlohu Sparku pri vývoji škálovateľných aplikácií strojového učenia a analytických aplikácií pomocou cloudových technológií. Kniha Beginning Apache Spark 2 vám poskytne úvod do Apache Spark a ukáže vám, ako s ním pracovať.
Popri tom objavíte odolné distribuované súbory údajov (RDD); použijete Spark SQL pre štruktúrované údaje; a naučíte sa spracúvať prúdy a vytvárať aplikácie v reálnom čase pomocou Spark Structured Streaming. Okrem toho sa naučíte základy Spark ML pre strojové učenie a mnoho ďalšieho.
Po prečítaní tejto knihy budete mať základy na to, aby ste sa stali odborníkmi v používaní Apache Spark a vedeli, kedy a ako ho použiť vo svojich aplikáciách na spracovanie veľkých objemov údajov.
Čo sa naučíte
⬤ Pochopiť jednotnú platformu Spark na spracovanie dát.
⬤ Ako spustiť Spark v Spark Shell alebo Databricks.
⬤ Používať a manipulovať s RDD.
⬤ Pracovať so štruktúrovanými údajmi pomocou Spark SQL prostredníctvom jeho operácií a pokročilých funkcií.
⬤ Vytváranie aplikácií v reálnom čase pomocou Spark Structured Streaming.
⬤ Vyvíjať inteligentné aplikácie pomocou knižnice Spark Machine Learning.
Pre koho je táto kniha určená
Programátorom a vývojárom pôsobiacim v oblasti veľkých dát, Hadoopu a Javy, ktorí však s platformou Apache Spark začínajú.