Dátová analýza s Hadoopom: Úvod pre dátových vedcov

Hodnotenie:   (4,2 z 5)

Dátová analýza s Hadoopom: Úvod pre dátových vedcov (Benjamin Bengfort)

Recenzie čitateľov

Zhrnutie:

Kniha je zdrojom informácií o technológii Hadoop a analýze veľkých dát so zameraním na základné aj pokročilé témy. Hoci poskytuje široký prehľad o ekosystéme Hadoop a obsahuje praktické príklady, má aj značné problémy s presnosťou kódu a zrozumiteľnosťou písania.

Výhody:

Komplexný prehľad Hadoopu a súvisiacich technológií
priateľský k začiatočníkom aj profesionálom
príklady sú užitočné pri praktickom učení
aktuálny prehľad starých aj nových technológií, ako sú MapReduce a Spark
poskytuje citácie na ďalšie čítanie.

Nevýhody:

Ukážkový kód často nezodpovedá opisom v knihe
pokyny na inštaláciu môžu byť mätúce
príklady môžu priniesť nesprávne výsledky
štýl písania je kritizovaný ako nedostatočne kvalitný
niektoré informácie sú zavádzajúce alebo nesprávne.

(na základe 9 čitateľských recenzií)

Pôvodný názov:

Data Analytics with Hadoop: An Introduction for Data Scientists

Obsah knihy:

Ste pripravení používať štatistické techniky a techniky strojového učenia vo veľkých súboroch údajov? Táto praktická príručka vám ukáže, prečo je ekosystém Hadoop na túto prácu ideálny.

Namiesto nasadenia, prevádzky alebo vývoja softvéru, ktoré sa zvyčajne spájajú s distribuovanými výpočtami, sa zameriate na konkrétne analýzy, ktoré môžete vytvoriť, techniky dátových skladov, ktoré Hadoop poskytuje, a pracovné postupy s údajmi vyššieho rádu, ktoré tento rámec dokáže vytvoriť. Dátoví vedci a analytici sa naučia vykonávať širokú škálu techník, od písania aplikácií MapReduce a Spark pomocou jazyka Python až po používanie pokročilého modelovania a správy údajov pomocou Spark MLlib, Hive a HBase.

Dozviete sa aj o analytických procesoch a dátových systémoch, ktoré sú k dispozícii na vytváranie a posilňovanie dátových produktov, ktoré dokážu spracovať - a vlastne aj vyžadujú - obrovské množstvo údajov. ⬤ Pochopíte základné koncepty Hadoopu a klastrových výpočtov ⬤ Použijete návrhové vzory a paralelné analytické algoritmy na vytváranie distribuovaných úloh na analýzu dát ⬤ Zoznámite sa so správou, dolovaním a skladovaním dát v distribuovanom kontexte pomocou Apache Hive a HBase ⬤ Použijete Sqoop a Apache Flume na prijímanie dát z relačných databáz ⬤ Programujete komplexné aplikácie Hadoop a Spark pomocou Apache Pig a Spark DataFrames ⬤ Vykonáte techniky strojového učenia, ako je klasifikácia, zhlukovanie a kolaboratívne filtrovanie pomocou Spark MLlib.

Ďalšie údaje o knihe:

ISBN:9781491913703
Autor:
Vydavateľ:
Väzba:Mäkká väzba
Rok vydania:2016
Počet strán:288

Nákup:

Momentálne k dispozícii, na sklade.

Ďalšie knihy autora:

Aplikovaná analýza textu s Pythonom: Umožnenie jazykovo orientovaných dátových produktov pomocou...
Prirodzený jazyk je jedným z najbohatších a...
Aplikovaná analýza textu s Pythonom: Umožnenie jazykovo orientovaných dátových produktov pomocou strojového učenia - Applied Text Analysis with Python: Enabling Language-Aware Data Products with Machine Learning
Dátová analýza s Hadoopom: Úvod pre dátových vedcov - Data Analytics with Hadoop: An Introduction...
Ste pripravení používať štatistické techniky a...
Dátová analýza s Hadoopom: Úvod pre dátových vedcov - Data Analytics with Hadoop: An Introduction for Data Scientists

Diela autora vydali tieto vydavateľstvá: