Hodnotenie:
Kniha o Hadoope poskytuje komplexný prehľad o modelovaní údajov, architektonických vzoroch a osvedčených postupoch pri práci s technológiami Hadoop. Hoci ponúka cenné poznatky a praktické príklady, niektorí čitatelia upozorňujú, že niektoré nástroje alebo informácie môžu byť zastarané, a je určená predovšetkým tým, ktorí už majú určité znalosti o Hadoop, a nie úplným začiatočníkom.
Výhody:** Dobre organizovaná a prehľadná štruktúra ** Komplexné pokrytie technológií Hadoop ** Ponúka praktické prípadové štúdie a osvedčené postupy pre reálne aplikácie ** Bohatý obsah; mnohí čitatelia ho považujú za pútavý a informatívny ** Vhodný pre vývojárov aj architektov s existujúcimi znalosťami o Hadoop ** Včasné zdôvodnenie výberu nástrojov a výberu architektúry
Nevýhody:** Niektoré informácie a nástroje môžu byť zastarané ** Nie je ideálna pre úplných začiatočníkov, pretože predpokladá predchádzajúce znalosti Hadoopu ** Niektoré pokročilé témy môžu byť pokryté na povrchnej úrovni
(na základe 22 čitateľských recenzií)
Hadoop Application Architectures: Designing Real-World Big Data Applications (Grover Rajat (Mark))
Získajte odborné poradenstvo o architektúre komplexných riešení na správu údajov s Apache Hadoop. Zatiaľ čo mnohé zdroje vysvetľujú, ako používať rôzne komponenty v ekosystéme Hadoop, táto praktická kniha vás prevedie architektonickými úvahami potrebnými na prepojenie týchto komponentov do kompletnej aplikácie šitej na mieru na základe konkrétneho prípadu použitia.
Na posilnenie týchto poznatkov poskytuje druhá časť knihy podrobné príklady architektúr používaných v niektorých najčastejšie sa vyskytujúcich aplikáciách Hadoop. Či už navrhujete novú aplikáciu Hadoop, alebo plánujete integrovať Hadoop do existujúcej dátovej infraštruktúry, Hadoop Application Architectures vás týmto procesom zručne prevedie.
Táto kniha zahŕňa:
⬤ Faktory, ktoré treba zvážiť pri používaní Hadoopu na ukladanie a modelovanie údajov.
⬤ Najlepšie postupy na presun údajov do systému a zo systému.
⬤ Rámce na spracovanie údajov vrátane MapReduce, Spark a Hive.
⬤ Obvyklé vzory spracovania dát v systéme Hadoop, ako je odstraňovanie duplicitných záznamov a používanie okennej analýzy.
⬤ Giraph, GraphX a ďalšie nástroje na spracovanie veľkých grafov v systéme Hadoop.
⬤ Používanie nástrojov na orchestráciu a plánovanie pracovných postupov, ako je Apache Oozie.
⬤ Spracovanie tokov v takmer reálnom čase pomocou Apache Storm, Apache Spark Streaming a Apache Flume.
⬤ Príklady architektúry pre analýzu clickstreamov, detekciu podvodov a dátové sklady.