Dátové potrubia s Apache Airflow

Hodnotenie:   (4,5 z 5)

Dátové potrubia s Apache Airflow (P. Harenslak Bas)

Recenzie čitateľov

Zhrnutie:

Knihu odporúčame ako komplexný zdroj informácií o Apache Airflow, ktorý efektívne pokrýva základné aj pokročilé témy. Štruktúra umožňuje čitateľom rýchlo pochopiť základy a zároveň poskytuje podrobné informácie pre skúsených praktikov. Bolo však zaznamenané, že diskusie o bezpečnosti sú odložené až na neskoršiu časť, čo niektorí čitatelia považujú za znepokojujúce.

Výhody:

Podrobné vysvetlenia, zahrnuté osvedčené postupy, prispôsobiteľné príklady kódu, pokrýva základy aj pokročilé témy, dobre napísané a štruktúrované, výborné pre nováčikov aj skúsených používateľov, obsahuje praktické recepty a realistické príklady, slúži ako skvelá referencia.

Nevýhody:

Bezpečnostné témy sú v knihe rozobrané neskoro (strana 322), niektorí čitatelia majú pocit, že v nej môžu chýbať bezprostredné praktické tipy pre aplikácie na pracovisku.

(na základe 12 čitateľských recenzií)

Pôvodný názov:

Data Pipelines with Apache Airflow

Obsah knihy:

Data Pipelines with Apache Airflow vás naučí, ako vytvárať a udržiavať efektívne dátové potrubia.

Zhrnutie

Úspešné potrubie efektívne presúva údaje, minimalizuje pauzy a blokovania medzi úlohami a udržiava každý proces na ceste v prevádzke. Apache Airflow poskytuje jediné prispôsobiteľné prostredie na vytváranie a správu dátových potrubí, čím eliminuje potrebu nesúrodej zbierky nástrojov, snehových vločiek kódu a domácich procesov. Kniha Data Pipelines with Apache Airflow vás na základe reálnych scenárov a príkladov naučí, ako zjednodušiť a automatizovať dátové potrubia, znížiť prevádzkovú réžiu a hladko integrovať všetky technológie vo vašom zásobníku.

Zakúpenie tlačenej knihy zahŕňa bezplatnú elektronickú knihu vo formátoch PDF, Kindle a ePub od Manning Publications.

O technológii

Dátové potrubia riadia tok údajov od počiatočného zberu cez konsolidáciu, čistenie, analýzu, vizualizáciu a ďalšie činnosti. Apache Airflow poskytuje jednotnú platformu, ktorú môžete používať na navrhovanie, implementáciu, monitorovanie a údržbu svojich potrubí. Vďaka jednoduchému používateľskému rozhraniu, možnostiam plug-and-play a flexibilnému skriptovaniu v jazyku Python je Airflow ideálny pre akúkoľvek úlohu správy údajov.

O knihe

Data Pipelines with Apache Airflow vás naučí, ako vytvárať a udržiavať efektívne dátové potrubia. Preskúmate najbežnejšie spôsoby použitia vrátane agregácie viacerých zdrojov údajov, pripojenia k dátovým jazerám a z nich a nasadenia v cloude. Táto praktická príručka, ktorá je sčasti referenciou a sčasti výučbou, sa zaoberá všetkými aspektmi usmernených acyklických grafov (DAG), ktoré poháňajú Airflow, a tým, ako ich prispôsobiť potrebám vášho potrubia.

Čo je vnútri

Zostavte, otestujte a nasaďte potrubia Airflow ako DAG.

Automatizujte presúvanie a transformáciu údajov.

Analyzujte historické súbory údajov pomocou spätného plnenia.

Vyvíjajte vlastné komponenty.

Nastavte Airflow v produkčných prostrediach.

O čitateľovi

Pre DevOps, dátových inžinierov, inžinierov strojového učenia a sysadminov so stredne pokročilou znalosťou jazyka Python.

O autorovi

Bas Harenslak a Julian de Ruiter sú dátoví inžinieri s rozsiahlymi skúsenosťami s používaním Airflow na vývoj potrubí pre veľké spoločnosti. Bas je tiež členom revízie Airflow.

Obsah

ČASŤ 1 - ZAČÍNAME.

1 Zoznámte sa s Apache Airflow.

2 Anatómia DAG Airflow.

3 Plánovanie v Airflow.

4 Šablónovanie úloh pomocou kontextu Airflow.

5 Definovanie závislostí medzi úlohami.

ČASŤ 2 - NAD RÁMEC ZÁKLADOV.

6 Spúšťanie pracovných postupov.

7 Komunikácia s externými systémami.

8 Vytváranie vlastných komponentov.

9 Testovanie.

10 Spúšťanie úloh v kontajneroch.

ČASŤ 3 - PRÚDENIE VZDUCHU V PRAXI.

11 Osvedčené postupy.

12 Prevádzka Airflow vo výrobe.

13 Zabezpečenie Airflow.

14 Projekt: Hľadanie najrýchlejšej cesty po New Yorku.

ČASŤ 4 - V OBLAKOCH.

15 Airflow v oblakoch.

16 Airflow v systéme AWS.

17 Airflow na Azure.

18 Airflow v GCP.

Ďalšie údaje o knihe:

ISBN:9781617296901
Autor:
Vydavateľ:
Väzba:Mäkká väzba
Rok vydania:2021
Počet strán:480

Nákup:

Momentálne k dispozícii, na sklade.

Ďalšie knihy autora:

Dátové potrubia s Apache Airflow - Data Pipelines with Apache Airflow
Data Pipelines with Apache Airflow vás naučí, ako vytvárať a udržiavať efektívne dátové...
Dátové potrubia s Apache Airflow - Data Pipelines with Apache Airflow

Diela autora vydali tieto vydavateľstvá: