Hodnotenie:
Kniha poskytuje hlboký a dôkladný prieskum moderných dátových architektúr so zameraním na delta architektúru, správu údajov a vytváranie dátových produktov v rámci dátovej siete. Zdôrazňuje tiež význam vizualizácií údajov a praktických aplikácií v reálnych scenároch s využitím jazyka Python.
Výhody:Komplexné pokrytie moderných dátových architektúr, praktické príklady v jazyku Python, zasvätený prieskum správy a integrity údajov, zameranie na MLOps a integráciu vizualizácií údajov, prístupné inžinierom, analytikom a manažérom.
Nevýhody:Môže byť príliš technická pre začiatočníkov bez predchádzajúcich znalostí dátových architektúr, niektorí čitatelia môžu považovať hĺbku za ohromujúcu a nemusí podrobne pokrývať všetky témy.
(na základe 5 čitateľských recenzií)
Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python
Budovanie škálovateľných a spoľahlivých dátových ekosystémov pomocou Data Mesh, Databricks Spark a Kafka
Kľúčové funkcie:
⬤ Rozvíjajte moderné dátové zručnosti používané v nových technológiách.
⬤ Učte sa pragmatické metodiky návrhu, ako sú Data Mesh a dátové jazerá.
⬤ Získajte hlbšie porozumenie správy údajov.
⬤ Zakúpenie tlačenej knihy alebo knihy pre Kindle zahŕňa bezplatnú elektronickú knihu vo formáte PDF.
Popis knihy:
Moderné dátové architektúry s Pythonom vás naučí, ako bezproblémovo začleniť pracovné toky strojového učenia a dátovej vedy do otvorených dátových platforiem. Naučíte sa, ako vziať svoje dáta a vytvoriť otvorené jazerá, ktoré fungujú s akoukoľvek technológiou, pomocou osvedčených techník vrátane medailónovej architektúry a Delta Lake.
Táto kniha vám pomôže pri vytváraní potrubí na otvorenej dátovej platforme Databricks pomocou jazyka SQL a jazyka Python. Získate prehľad o zápisníkoch a aplikáciách napísaných v jazyku Python s použitím štandardných nástrojov softvérového inžinierstva, ako sú git, pre-commit, Jenkins a Github. Ďalej sa ponoríte do prúdového a dávkového spracovania dát pomocou Apache Spark a Confluent Kafka. Postupne sa naučíte, ako nasadzovať svoje zdroje pomocou infraštruktúry ako kódu a ako automatizovať pracovné postupy a vývoj kódu. Keďže schopnosť každej dátovej platformy spracovať a pracovať s AI a ML je dôležitou súčasťou, preskúmate aj základy ML a ako pracovať s modernými nástrojmi MLOps. Nakoniec získate praktické skúsenosti s Apache Spark, jednou z kľúčových dátových technológií na súčasnom trhu.
Na konci tejto knihy nazbierate množstvo praktických a teoretických vedomostí na budovanie, správu, orchestráciu a architektúru dátových ekosystémov.
Čo sa naučíte:
⬤ Poznáte dátové vzory vrátane delta architektúry.
⬤ Objavíte, ako zvýšiť výkon pomocou vnútorných prvkov Sparku.
⬤ Zistíte, ako navrhovať kritické dátové diagramy.
⬤ Preskúmať MLOps s nástrojmi ako AutoML a MLflow.
⬤ Získajte skúsenosti s vytváraním dátových produktov v dátovej sieti.
⬤ Objavte správu údajov a vybudujte si dôveru vo svoje údaje.
⬤ Zavedenie vizualizácie údajov a informačných panelov do vašej dátovej praxe.
Pre koho je táto kniha určená:
Táto kniha je určená pre vývojárov, analytických inžinierov a manažérov, ktorí chcú ďalej rozvíjať dátový ekosystém vo svojej organizácii. Hoci nie sú nevyhnutnou podmienkou, základná znalosť jazyka Python a predchádzajúce skúsenosti s údajmi vám pomôžu pri čítaní a sledovaní príkladov.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)