Moderné dátové architektúry s Pythonom: Praktická príručka na vytváranie a nasadzovanie dátových potrubí, dátových skladov a dátových jazier pomocou jazyka Python

Hodnotenie:   (4,7 z 5)

Moderné dátové architektúry s Pythonom: Praktická príručka na vytváranie a nasadzovanie dátových potrubí, dátových skladov a dátových jazier pomocou jazyka Python (Brian Lipp)

Recenzie čitateľov

Zhrnutie:

Kniha poskytuje hlboký a dôkladný prieskum moderných dátových architektúr so zameraním na delta architektúru, správu údajov a vytváranie dátových produktov v rámci dátovej siete. Zdôrazňuje tiež význam vizualizácií údajov a praktických aplikácií v reálnych scenároch s využitím jazyka Python.

Výhody:

Komplexné pokrytie moderných dátových architektúr, praktické príklady v jazyku Python, zasvätený prieskum správy a integrity údajov, zameranie na MLOps a integráciu vizualizácií údajov, prístupné inžinierom, analytikom a manažérom.

Nevýhody:

Môže byť príliš technická pre začiatočníkov bez predchádzajúcich znalostí dátových architektúr, niektorí čitatelia môžu považovať hĺbku za ohromujúcu a nemusí podrobne pokrývať všetky témy.

(na základe 5 čitateľských recenzií)

Pôvodný názov:

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Obsah knihy:

Budovanie škálovateľných a spoľahlivých dátových ekosystémov pomocou Data Mesh, Databricks Spark a Kafka

Kľúčové funkcie:

⬤ Rozvíjajte moderné dátové zručnosti používané v nových technológiách.

⬤ Učte sa pragmatické metodiky návrhu, ako sú Data Mesh a dátové jazerá.

⬤ Získajte hlbšie porozumenie správy údajov.

⬤ Zakúpenie tlačenej knihy alebo knihy pre Kindle zahŕňa bezplatnú elektronickú knihu vo formáte PDF.

Popis knihy:

Moderné dátové architektúry s Pythonom vás naučí, ako bezproblémovo začleniť pracovné toky strojového učenia a dátovej vedy do otvorených dátových platforiem. Naučíte sa, ako vziať svoje dáta a vytvoriť otvorené jazerá, ktoré fungujú s akoukoľvek technológiou, pomocou osvedčených techník vrátane medailónovej architektúry a Delta Lake.

Táto kniha vám pomôže pri vytváraní potrubí na otvorenej dátovej platforme Databricks pomocou jazyka SQL a jazyka Python. Získate prehľad o zápisníkoch a aplikáciách napísaných v jazyku Python s použitím štandardných nástrojov softvérového inžinierstva, ako sú git, pre-commit, Jenkins a Github. Ďalej sa ponoríte do prúdového a dávkového spracovania dát pomocou Apache Spark a Confluent Kafka. Postupne sa naučíte, ako nasadzovať svoje zdroje pomocou infraštruktúry ako kódu a ako automatizovať pracovné postupy a vývoj kódu. Keďže schopnosť každej dátovej platformy spracovať a pracovať s AI a ML je dôležitou súčasťou, preskúmate aj základy ML a ako pracovať s modernými nástrojmi MLOps. Nakoniec získate praktické skúsenosti s Apache Spark, jednou z kľúčových dátových technológií na súčasnom trhu.

Na konci tejto knihy nazbierate množstvo praktických a teoretických vedomostí na budovanie, správu, orchestráciu a architektúru dátových ekosystémov.

Čo sa naučíte:

⬤ Poznáte dátové vzory vrátane delta architektúry.

⬤ Objavíte, ako zvýšiť výkon pomocou vnútorných prvkov Sparku.

⬤ Zistíte, ako navrhovať kritické dátové diagramy.

⬤ Preskúmať MLOps s nástrojmi ako AutoML a MLflow.

⬤ Získajte skúsenosti s vytváraním dátových produktov v dátovej sieti.

⬤ Objavte správu údajov a vybudujte si dôveru vo svoje údaje.

⬤ Zavedenie vizualizácie údajov a informačných panelov do vašej dátovej praxe.

Pre koho je táto kniha určená:

Táto kniha je určená pre vývojárov, analytických inžinierov a manažérov, ktorí chcú ďalej rozvíjať dátový ekosystém vo svojej organizácii. Hoci nie sú nevyhnutnou podmienkou, základná znalosť jazyka Python a predchádzajúce skúsenosti s údajmi vám pomôžu pri čítaní a sledovaní príkladov.

Ďalšie údaje o knihe:

ISBN:9781801070492
Autor:
Vydavateľ:
Jazyk:anglicky
Väzba:Mäkká väzba

Nákup:

Momentálne k dispozícii, na sklade.

Ďalšie knihy autora:

The Data Wrangling Workshop, druhé vydanie: Vytvorte si vlastné užitočné poznatky pomocou údajov z...
Príručka pre začiatočníkov, ako zjednodušiť...
The Data Wrangling Workshop, druhé vydanie: Vytvorte si vlastné užitočné poznatky pomocou údajov z viacerých nespracovaných zdrojov - The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources
Moderné dátové architektúry s Pythonom: Praktická príručka na vytváranie a nasadzovanie dátových...
Budovanie škálovateľných a spoľahlivých dátových...
Moderné dátové architektúry s Pythonom: Praktická príručka na vytváranie a nasadzovanie dátových potrubí, dátových skladov a dátových jazier pomocou jazyka Python - Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Diela autora vydali tieto vydavateľstvá:

© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)