Hodnotenie:
Knihu odporúčame ako komplexný zdroj informácií o Apache Airflow, ktorý efektívne pokrýva základné aj pokročilé témy. Štruktúra umožňuje čitateľom rýchlo pochopiť základy a zároveň poskytuje podrobné informácie pre skúsených praktikov. Bolo však zaznamenané, že diskusie o bezpečnosti sú odložené až na neskoršiu časť, čo niektorí čitatelia považujú za znepokojujúce.
Výhody:Podrobné vysvetlenia, zahrnuté osvedčené postupy, prispôsobiteľné príklady kódu, pokrýva základy aj pokročilé témy, dobre napísané a štruktúrované, výborné pre nováčikov aj skúsených používateľov, obsahuje praktické recepty a realistické príklady, slúži ako skvelá referencia.
Nevýhody:Bezpečnostné témy sú v knihe rozobrané neskoro (strana 322), niektorí čitatelia majú pocit, že v nej môžu chýbať bezprostredné praktické tipy pre aplikácie na pracovisku.
(na základe 12 čitateľských recenzií)
Data Pipelines with Apache Airflow
Data Pipelines with Apache Airflow vás naučí, ako vytvárať a udržiavať efektívne dátové potrubia.
Zhrnutie
Úspešné potrubie efektívne presúva údaje, minimalizuje pauzy a blokovania medzi úlohami a udržiava každý proces na ceste v prevádzke. Apache Airflow poskytuje jediné prispôsobiteľné prostredie na vytváranie a správu dátových potrubí, čím eliminuje potrebu nesúrodej zbierky nástrojov, snehových vločiek kódu a domácich procesov. Kniha Data Pipelines with Apache Airflow vás na základe reálnych scenárov a príkladov naučí, ako zjednodušiť a automatizovať dátové potrubia, znížiť prevádzkovú réžiu a hladko integrovať všetky technológie vo vašom zásobníku.
Zakúpenie tlačenej knihy zahŕňa bezplatnú elektronickú knihu vo formátoch PDF, Kindle a ePub od Manning Publications.
O technológii
Dátové potrubia riadia tok údajov od počiatočného zberu cez konsolidáciu, čistenie, analýzu, vizualizáciu a ďalšie činnosti. Apache Airflow poskytuje jednotnú platformu, ktorú môžete používať na navrhovanie, implementáciu, monitorovanie a údržbu svojich potrubí. Vďaka jednoduchému používateľskému rozhraniu, možnostiam plug-and-play a flexibilnému skriptovaniu v jazyku Python je Airflow ideálny pre akúkoľvek úlohu správy údajov.
O knihe
Data Pipelines with Apache Airflow vás naučí, ako vytvárať a udržiavať efektívne dátové potrubia. Preskúmate najbežnejšie spôsoby použitia vrátane agregácie viacerých zdrojov údajov, pripojenia k dátovým jazerám a z nich a nasadenia v cloude. Táto praktická príručka, ktorá je sčasti referenciou a sčasti výučbou, sa zaoberá všetkými aspektmi usmernených acyklických grafov (DAG), ktoré poháňajú Airflow, a tým, ako ich prispôsobiť potrebám vášho potrubia.
Čo je vnútri
Zostavte, otestujte a nasaďte potrubia Airflow ako DAG.
Automatizujte presúvanie a transformáciu údajov.
Analyzujte historické súbory údajov pomocou spätného plnenia.
Vyvíjajte vlastné komponenty.
Nastavte Airflow v produkčných prostrediach.
O čitateľovi
Pre DevOps, dátových inžinierov, inžinierov strojového učenia a sysadminov so stredne pokročilou znalosťou jazyka Python.
O autorovi
Bas Harenslak a Julian de Ruiter sú dátoví inžinieri s rozsiahlymi skúsenosťami s používaním Airflow na vývoj potrubí pre veľké spoločnosti. Bas je tiež členom revízie Airflow.
Obsah
ČASŤ 1 - ZAČÍNAME.
1 Zoznámte sa s Apache Airflow.
2 Anatómia DAG Airflow.
3 Plánovanie v Airflow.
4 Šablónovanie úloh pomocou kontextu Airflow.
5 Definovanie závislostí medzi úlohami.
ČASŤ 2 - NAD RÁMEC ZÁKLADOV.
6 Spúšťanie pracovných postupov.
7 Komunikácia s externými systémami.
8 Vytváranie vlastných komponentov.
9 Testovanie.
10 Spúšťanie úloh v kontajneroch.
ČASŤ 3 - PRÚDENIE VZDUCHU V PRAXI.
11 Osvedčené postupy.
12 Prevádzka Airflow vo výrobe.
13 Zabezpečenie Airflow.
14 Projekt: Hľadanie najrýchlejšej cesty po New Yorku.
ČASŤ 4 - V OBLAKOCH.
15 Airflow v oblakoch.
16 Airflow v systéme AWS.
17 Airflow na Azure.
18 Airflow v GCP.