Hodnotenie:
Niektorí knihu hodnotia pozitívne ako príjemný a praktický úvod do Hadoopu a Sparku, iní ju kritizujú za to, že je povrchná a neposkytuje hlboké znalosti o týchto témach.
Výhody:⬤ Dobre napísané
⬤ príjemné čítanie
⬤ poskytuje dobrý úvod do Hadoop/Spark
⬤ zahŕňa praktické prípady použitia v dátovej vede
⬤ vhodné pre tých, ktorí už majú nejaké skúsenosti.
⬤ Chýba hĺbka a významné pokrytie problematiky Hadoop/Spark
⬤ považované za príliš povrchné a všeobecné
⬤ zavádzajúci názov
⬤ drahé za poskytovaný obsah
⬤ nevhodné pre začiatočníkov, ktorí hľadajú komplexné vedomosti.
(na základe 8 čitateľských recenzií)
Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale
Kompletný sprievodca dátovou vedou s Hadoopom - pre technických odborníkov, podnikateľov a študentov
Dopyt po odborníkoch, ktorí dokážu riešiť skutočné problémy dátovej vedy pomocou Hadoopu a Sparku, prudko rastie. Practical Data Science with Hadoop(R) and Spark je kompletný sprievodca, ktorý vám to umožní. Traja poprední odborníci, ktorí čerpajú z obrovských skúseností s Hadoopom a veľkými dátami, prinášajú všetko, čo potrebujete: koncepty na vysokej úrovni, techniky na hlboké ponorenie, reálne prípady použitia, praktické aplikácie a praktické návody.
Autori predstavujú základy dátovej vedy a moderný ekosystém Hadoop a vysvetľujú, ako sa Hadoop a Spark vyvinuli do efektívnej platformy na riešenie problémov dátovej vedy vo veľkom meradle. Okrem komplexného pokrytia aplikácií autori poskytujú aj užitočné usmernenia týkajúce sa dôležitých krokov prijímania údajov, mungovania údajov a vizualizácie.
Po vytvorení základov sa autori zameriavajú na konkrétne aplikácie vrátane strojového učenia, prediktívneho modelovania na analýzu sentimentu, zhlukovania na analýzu dokumentov, detekcie anomálií a spracovania prirodzeného jazyka (NLP).
Táto príručka poskytuje silný technický základ pre tých, ktorí chcú robiť praktickú dátovú vedu, a tiež predstavuje obchodne orientované usmernenia o tom, ako použiť Hadoop a Spark na optimalizáciu návratnosti investícií do iniciatív dátovej vedy.
Naučte sa.
⬤ Čo je dátová veda, ako sa vyvíja a ako si naplánovať kariéru v oblasti dátovej vedy.
⬤ Ako objem, rôznorodosť a rýchlosť údajov formujú prípady použitia dátovej vedy.
⬤ Hadoop a jeho ekosystém vrátane HDFS, MapReduce, YARN a Spark.
⬤ import údajov pomocou Hive a Spark.
⬤ Kvalita údajov, predbežné spracovanie, príprava a modelovanie.
⬤ Vizualizácia: zobrazovanie poznatkov z obrovských súborov údajov.
⬤ Strojové učenie: klasifikácia, regresia, zhlukovanie a detekcia anomálií.
⬤ Algoritmy a nástroje Hadoop na prediktívne modelovanie.
⬤ Klastrová analýza a funkcie podobnosti.
⬤ Detekcia anomálií veľkého rozsahu.
⬤ NLP: aplikácia dátovej vedy na ľudský jazyk.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)