Hodnotenie:
Kniha „Querying Databricks with Spark SQL“ ponúka dôkladné pokrytie základných aj pokročilých konceptov jazyka Spark SQL. Je dobre štruktúrovaná pomocou obchodných scenárov na predstavenie dotazov SQL a poskytuje jasné vysvetlenia. Niektorí čitatelia však našli problémy s návodmi a organizáciou.
Výhody:⬤ Komplexné pokrytie jazyka Spark SQL, vhodné pre začiatočníkov aj pokročilých používateľov
⬤ prehľadná štruktúra a vysvetlenia
⬤ dobre navrhnutá vzorová databáza
⬤ cenná časť „Triky a pasce“
⬤ uspokojivé čítanie pre odborníkov na SQL, ktorí hľadajú pokročilé témy.
⬤ Pokyny na nastavenie súboru údajov boli nejasné
⬤ zdroje GitHub boli zle usporiadané
⬤ kvalita väzby knihy by sa mohla zlepšiť
⬤ chýbali témy, ako sú príkazy SQL MERGE, UPDATE, DELETE
⬤ počiatočný zádrhel s pokynmi na import dátových súborov.
(na základe 2 čitateľských recenzií)
Querying Databricks with Spark SQL
Praktický sprievodca používaním jazyka Spark SQL na vykonávanie zložitých dotazov na údaje Databricks
Kľúčové vlastnosti
● Naučte sa SQL od základov, bez predchádzajúcich znalostí programovania alebo SQL.
● Postupne budujte svoje znalosti a zručnosti, od základných dotazov na údaje až po komplexné analýzy.
● Získajte praktické skúsenosti s SQL, ktoré pokrývajú všetky úrovne znalostí od začiatočníka po experta.
Popis
Databricks vyniká ako široko prijímaná platforma určená na vytváranie dátových jazier. V rámci svojho rámca rozširuje podporu špecializovanej verzie štruktúrovaného dotazovacieho jazyka (SQL) známeho ako Spark SQL. Ak máte záujem dozvedieť sa viac o tom, ako používať Spark SQL na analýzu údajov v dátovom jazere, potom je táto kniha určená práve vám.
Kniha sa zaoberá všetkým od základných dotazov až po zložité úlohy spracovania údajov. Začína úvodom do jazyka SQL a Sparku. Potom sa venuje základom jazyka SQL vrátane dátových typov, operátorov a klauzúl. Niekoľko ďalších kapitol sa zameriava na filtrovanie, agregáciu a výpočty. Okrem toho sa zaoberá dátumami a časmi, formátovaním výstupov a používaním logiky v dotazoch. Venuje sa aj spájaniu tabuliek, poddotazom, odvodeným tabuľkám a bežným tabuľkovým výrazom. Okrem toho sa zaoberá korelovanými poddotazmi, spájaním a filtrovaním súborov údajov, používaním jazyka SQL vo výpočtoch, segmentáciou a klasifikáciou údajov, priebežnou analýzou a analýzou údajov v čase. Knihu uzatvára kapitola o pokročilej prezentácii údajov.
Na konci knihy budete schopní používať jazyk Spark SQL na vykonávanie komplexných úloh analýzy údajov na dátových jazerách.
Čo sa naučíte
● Používať jazyk Spark SQL na čítanie údajov z dátového jazera.
● Naučíte sa filtrovať, agregovať a počítať údaje pomocou jazyka Spark SQL.
● Naučíte sa spájať tabuľky, používať poddotazy a vytvárať odvodené tabuľky v jazyku Spark SQL.
● Analyzujte údaje v čase pomocou jazyka Spark SQL na sledovanie trendov a identifikáciu vzorov v údajoch.
● Prezentujte údaje vizuálne príťažlivým spôsobom pomocou jazyka Spark SQL.
Pre koho je táto kniha určená
Táto kniha je určená pre každého, kto sa chce naučiť používať jazyk SQL na analýzu veľkých dát. Či už ste dátový analytik, študent, databázový vývojár, účtovník, obchodný analytik, dátový vedec alebo ktokoľvek iný, kto potrebuje získať poznatky z veľkých súborov údajov, táto kniha vás naučí zručnostiam, ktoré potrebujete na to, aby ste túto prácu zvládli.
Obsah
1. Písanie základných dotazov SQL
2. Filtrovanie údajov
3. Aplikácia komplexných filtrov na dotazy
4. Jednoduché výpočty
5. Agregácia výstupov
6. Práca s dátumami v Databricks
7. Formátovanie textu vo výstupe dotazu
8. Formátovanie čísel a dátumov
9. Používanie základnej logiky na zlepšenie analýzy
10. Používanie viacerých tabuliek pri vyhľadávaní údajov
11. Používanie pokročilých spojov tabuliek
12. Poddotazovanie
13. Odvodené tabuľky
14. Bežné tabuľkové výrazy
15. Súvislé poddotazy
16. Manipulácia so súbormi údajov
17. Používanie jazyka SQL na pokročilejšie výpočty
18. Segmentácia a klasifikácia údajov
19. Analýza rolovania
20. Analýza údajov v čase
21. Komplexný výstup údajov
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)