Data Engineering with Python: Pracujte s obrovskými súbormi údajov a navrhujte dátové modely a automatizujte dátové potrubia pomocou jazyka Python

Hodnotenie:   (4,1 z 5)

Data Engineering with Python: Pracujte s obrovskými súbormi údajov a navrhujte dátové modely a automatizujte dátové potrubia pomocou jazyka Python (Paul Crickard)

Recenzie čitateľov

Zhrnutie:

Kniha „Data Engineering With Python“ je podľa recenzií používateľov zmiešaným vrecom kladov a záporov. Hoci poskytuje solídny úvod do kľúčových pojmov v dátovom inžinierstve a považuje sa za čitateľnú s praktickými príkladmi, trpí značnými problémami týkajúcimi sa technickej presnosti a aktuálnosti obsahu. Viacerí čitatelia považovali zameranie na určité nástroje, najmä NiFi, za zavádzajúce vzhľadom na názov knihy a mnohí uvádzali, že sa stretli s množstvom chýb a slabou úpravou, ktoré bránia praktickému využitiu materiálu.

Výhody:

Solídny úvod do koncepcií dátového inžinierstva a pipeliningu.
Praktické a názorné príklady, najmä s nástrojmi ako Pandas, Zookeeper, Kafka a Spark.
Užitočné pre začínajúcich softvérových inžinierov a pre tých, ktorí poznajú analýzu údajov.
Pokrytie rôznych nástrojov a konceptov dátového inžinierstva.
Jednoduchá čitateľnosť.

Nevýhody:

Početné chyby a preklepy v celej knihe, ktoré vedú k frustrácii.
Neaktuálny obsah a inštalačné pokyny kriticky ovplyvňujú použiteľnosť.
Veľké zameranie na SQL s minimálnym pokrytím databáz NoSQL.
Medzery v inštrukciách, najmä pri nastavovaní nástrojov ako NiFi.
Zavádzajúci názov, keďže zdôrazňuje NiFi pred používaním Pythonu.
Nedostatočná prehľadnosť príkladov a odkazov, čo robí knihu náročnou pre začiatočníkov.

(na základe 27 čitateľských recenzií)

Pôvodný názov:

Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python

Obsah knihy:

Budovanie, monitorovanie a správa dátových potrubí v reálnom čase na efektívne vytváranie infraštruktúry dátového inžinierstva pomocou open-source projektov Apache

Kľúčové funkcie:

⬤ Získajte prehľad o dátových architektúrach, príprave údajov a zručnostiach v oblasti optimalizácie údajov pomocou praktických príkladov.

⬤ Navrhnite dátové modely a naučte sa extrahovať, transformovať a načítavať (ETL) dáta pomocou jazyka Python.

⬤ Naplánujte, automatizujte a monitorujte komplexné dátové potrubia v produkcii.

Popis knihy

Dátové inžinierstvo poskytuje základ pre dátovú vedu a analytiku a tvorí dôležitú súčasť všetkých podnikov. Táto kniha vám pomôže preskúmať rôzne nástroje a metódy, ktoré sa používajú na pochopenie procesu dátového inžinierstva pomocou jazyka Python.

Kniha vám ukáže, ako riešiť výzvy, ktorým bežne čelíte v rôznych aspektoch dátového inžinierstva. Začnete úvodom do základov dátového inžinierstva spolu s technológiami a rámcami potrebnými na vytvorenie dátových potrubí na prácu s veľkými súbormi údajov. Naučíte sa, ako transformovať a čistiť údaje a vykonávať analýzy, aby ste z údajov vyťažili čo najviac. Postupne zistíte, ako pracovať s veľkými dátami rôznej zložitosti a produkčnými databázami a ako budovať dátové potrubia. Na základe reálnych príkladov budete budovať architektúry, na ktorých sa naučíte nasadzovať dátové potrubia.

Na konci tejto knihy o jazyku Python získate jasné pochopenie techník modelovania údajov a budete schopní s istotou budovať dátové inžinierske pipeline na sledovanie údajov, vykonávanie kontrol kvality a vykonávanie potrebných zmien v produkcii.

Čo sa naučíte

⬤ Pochopiť, ako dátové inžinierstvo podporuje pracovné postupy dátovej vedy.

⬤ Zistíte, ako získavať údaje zo súborov a databáz a následne ich čistiť, transformovať a obohacovať.

⬤ Konfigurovať procesory na spracovanie rôznych formátov súborov, ako aj relačných a NoSQL databáz.

⬤ Zistite, ako implementovať dátový kanál a prístrojový panel na vizualizáciu výsledkov.

⬤ Používajte etapizáciu a validáciu na kontrolu údajov pred ich uložením do skladu.

⬤ Vytvárajte potrubia v reálnom čase s oblasťami etapizácie, ktoré vykonávajú validáciu a riešia zlyhania.

⬤ Získajte skúsenosti s nasadzovaním potrubí v produkčnom prostredí.

Pre koho je táto kniha určená

Táto kniha je určená dátovým analytikom, vývojárom ETL a všetkým, ktorí chcú začať alebo prejsť na oblasť dátového inžinierstva alebo si osviežiť svoje znalosti dátového inžinierstva pomocou jazyka Python. Táto kniha bude užitočná aj pre študentov, ktorí si plánujú vybudovať kariéru v oblasti dátového inžinierstva, alebo pre IT profesionálov, ktorí sa pripravujú na prechod. Nevyžadujú sa žiadne predchádzajúce znalosti dátového inžinierstva.

Ďalšie údaje o knihe:

ISBN:9781839214189
Autor:
Vydavateľ:
Väzba:Mäkká väzba

Nákup:

Momentálne k dispozícii, na sklade.

Ďalšie knihy autora:

Data Engineering with Python: Pracujte s obrovskými súbormi údajov a navrhujte dátové modely a...
Budovanie, monitorovanie a správa dátových potrubí...
Data Engineering with Python: Pracujte s obrovskými súbormi údajov a navrhujte dátové modely a automatizujte dátové potrubia pomocou jazyka Python - Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python

Diela autora vydali tieto vydavateľstvá: