Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 4 hlasoch.
Big Data Science & Analytics: A Hands-On Approach
Údaje a informácie sú palivom tejto novej éry, v ktorej výkonné analytické algoritmy spaľujú toto palivo na generovanie rozhodnutí, ktoré by mali vytvoriť inteligentnejší a efektívnejší svet pre život nás všetkých. Táto nová oblasť technológií bola definovaná ako Big Data Science a Analytics a priemyselné a akademické komunity si ju uvedomujú ako konkurencieschopnú technológiu, ktorá môže priniesť významné nové bohatstvo a príležitosti.
Veľké objemy údajov sa definujú ako súbory údajov, ktorých objem, rýchlosť alebo rôznorodosť je taká veľká, že je ťažké tieto údaje uchovávať, spravovať, spracovávať a analyzovať pomocou tradičných databáz a nástrojov na spracovanie údajov. Veda a analytika veľkých dát sa zaoberá zberom, ukladaním, spracovaním a analýzou údajov obrovského rozsahu. Priemyselné prieskumy, napríklad od spoločností Gartner a e-Skills, predpovedajú, že len pre inžinierov a vedcov vyškolených v oblasti dátovej vedy a analytiky bude viac ako 2 milióny voľných pracovných miest a že trh práce v tejto oblasti rastie 150-percentným medziročným tempom.
Túto učebnicu sme napísali ako súčasť našej rozširujúcej sa série "A Hands-On Approach"(TM), aby sme uspokojili túto potrebu na vysokých školách a univerzitách a tiež pre poskytovateľov služieb v oblasti veľkých dát, ktorí môžu mať záujem ponúknuť širší pohľad na túto rozvíjajúcu sa oblasť ako doplnok k svojim školiacim programom pre zákazníkov a vývojárov. Očakáva sa, že typický čitateľ absolvoval niekoľko kurzov programovania s použitím tradičných vysokoúrovňových jazykov na vysokoškolskej úrovni a je buď študentom posledného ročníka alebo začínajúcim absolventom niektorého z odborov vedy, techniky, inžinierstva alebo matematiky (STEM). Sprievodná webová stránka k tejto knihe obsahuje ďalšiu podporu pre výučbu a učenie (www.big-data-analytics-book.com).
Kniha je rozdelená do troch hlavných častí, ktoré obsahujú celkovo dvanásť kapitol. Prvá časť obsahuje úvod do problematiky veľkých dát, aplikácií veľkých dát a modelov a architektúr vedy a analýzy veľkých dát. Navrhuje sa nová metodika návrhu aplikačného systému pre vedu o údajoch a analytiku a opisuje sa jej realizácia prostredníctvom využitia open-source rámcov pre veľké údaje. Táto metodika opisuje aplikácie na analýzu veľkých dát ako realizáciu navrhnutých modelov Alpha, Beta, Gamma a Delta, ktoré zahŕňajú nástroje a rámce na zber a prijímanie údajov z rôznych zdrojov do infraštruktúry na analýzu veľkých dát, zahŕňajúce distribuované súborové systémy a nerelačné databázy (NoSQL) na ukladanie údajov a rámce na spracovanie údajov pre dávkovú analýzu a analýzu v reálnom čase. Táto nová metodika tvorí pedagogický základ tejto knihy.
V druhej časti sa čitateľ zoznámi s rôznymi nástrojmi a rámcami na analýzu veľkých dát a s architektonickými a programovými aspektmi týchto rámcov na príkladoch v jazyku Python. Opisujeme Publish-Subscribe messaging frameworky (Kafka a Kinesis), Source-Sink konektory (Flume), databázové konektory (Sqoop), Messaging Queues (RabbitMQ, ZeroMQ, RestMQ, Amazon SQS) a vlastné konektory založené na REST, WebSocket a MQTT. Čitateľ sa zoznámi s ukladaním údajov, dávkovou analýzou a analýzou v reálnom čase a interaktívnymi dopytovacími rámcami vrátane HDFS, Hadoop, MapReduce, YARN, Pig, Oozie, Spark, Solr, HBase, Storm, Spark Streaming, Spark SQL, Hive, Amazon Redshift a Google BigQuery. Opísané sú aj obslužné databázy (MySQL, Amazon DynamoDB, Cassandra, MongoDB) a webový rámec Django Python.
V tretej časti sa čitateľ zoznámi s rôznymi algoritmami strojového učenia na príkladoch s využitím rámcov Spark MLlib a H2O a s vizualizáciami pomocou rámcov ako Lightning, Pygal a Seaborn.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)