The Data Wrangling Workshop, druhé vydanie: Vytvorte si vlastné užitočné poznatky pomocou údajov z viacerých nespracovaných zdrojov

Hodnotenie:   (4,6 z 5)

The Data Wrangling Workshop, druhé vydanie: Vytvorte si vlastné užitočné poznatky pomocou údajov z viacerých nespracovaných zdrojov (Brian Lipp)

Recenzie čitateľov

Zhrnutie:

Kniha je veľmi odporúčaným zdrojom informácií pre začiatočníkov v oblasti dátovej vedy, konkrétne v oblasti spracovania údajov. Ponúka praktický, praktický prístup s podrobnými vysvetleniami a príkladmi. Hoci základný obsah a štruktúra sú dobre hodnotené, niekoľko čitateľov upozornilo na prítomnosť preklepov a chýb, ktoré by mohli začínajúcich používateľov zmiasť.

Výhody:

Dôkladné vysvetlenia kódu, budovanie intuície pre začiatočníkov.
Komplexné pokrytie dátových štruktúr, modulov a techník dôležitých pre prácu s údajmi.
Praktické cvičenia a zdroje na stiahnutie zvyšujú zážitok z učenia.
Poskytuje praktické prípady použitia a príklady na ilustráciu konceptov.
Vhodné pre začiatočníkov aj pre tých, ktorí si chcú zdokonaliť svoje zručnosti.

Nevýhody:

Prítomnosť preklepov a chýb v príkladoch, ktoré môžu začiatočníkov frustrovať.
Kniha sa zameriava skôr na praktické aplikácie („čo je“) než na teoretické vysvetlenia („prečo je“).

(na základe 11 čitateľských recenzií)

Pôvodný názov:

The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources

Obsah knihy:

Príručka pre začiatočníkov, ako zjednodušiť procesy extrakcie, transformácie a načítania (ETL) pomocou praktických tipov, trikov a osvedčených postupov zábavnou a interaktívnou formou

Kľúčové vlastnosti

⬤ Preskúmajte spracovanie údajov pomocou reálnych príkladov a prípadov použitia v podnikaní.

⬤ Naštudujte si rôzne spôsoby, ako získať z údajov čo najväčšiu hodnotu za minimálny čas.

⬤ Podporujte svoje vedomosti bonusovými témami, ako je generovanie náhodných údajov a kontrola integrity údajov.

Popis knihy

Hoci máme k dispozícii obrovské množstvo údajov, v surovej podobe nie sú užitočné. Aby mali údaje zmysel, musia byť kurátorsky spracované a vylepšené.

Ak ste začiatočník, potom vám The Data Wrangling Workshop pomôže tento proces rozobrať. Začnete od základov a budete budovať svoje znalosti, pričom budete postupovať od základných aspektov, ktoré stoja za spracovaním údajov, až po používanie najpopulárnejších nástrojov a techník.

Táto kniha začína tým, že vám ukáže, ako pracovať s dátovými štruktúrami pomocou jazyka Python. Prostredníctvom príkladov a aktivít pochopíte, prečo by ste sa mali držať ďalej od tradičných metód čistenia údajov používaných v iných jazykoch a využiť špecializované predpripravené procedúry v jazyku Python. Neskôr sa naučíte, ako používať ten istý backend jazyka Python na získavanie a transformáciu údajov z celého radu zdrojov vrátane internetu, veľkých databázových trezorov a finančných tabuliek programu Excel. Aby ste sa mohli pripraviť na náročnejšie scenáre, kniha vás naučí, ako pracovať s chýbajúcimi alebo nesprávnymi údajmi a ako ich preformátovať na základe požiadaviek vášho následného analytického nástroja.

Na konci tejto knihy si osvojíte dôkladné znalosti o tom, ako vykonávať spracovanie údajov pomocou jazyka Python, a naučíte sa niekoľko techník a osvedčených postupov na efektívne získavanie, čistenie, transformáciu a formátovanie údajov z rôznorodých zdrojov.

Čo sa naučíte

⬤ Zoznámite sa so základmi spracovania údajov.

⬤ Pochopiť, ako modelovať údaje pomocou náhodného generovania údajov a kontroly integrity údajov.

⬤ Zistíte, ako skúmať údaje pomocou popisnej štatistiky a techník vykresľovania.

⬤ Preskúmajte, ako vyhľadávať a získavať informácie pomocou regulárnych výrazov.

⬤ Ponorte sa do bežne používaných knižníc Pythonu pre dátovú vedu.

⬤ Získajte prehľad o tom, ako spracovať a kompenzovať chýbajúce údaje.

Pre koho je táto kniha určená

Workshop Data Wrangling je určený pre vývojárov, dátových analytikov a biznis analytikov, ktorí sa chcú venovať kariére plnohodnotného dátového vedca alebo analytika. Hoci je táto kniha určená pre začiatočníkov, ktorí chcú začať pracovať s údajmi (data wrangling), na jednoduché pochopenie konceptov, ktoré sú tu zahrnuté, je potrebná predchádzajúca praktická znalosť programovacieho jazyka Python. Pomôže aj základná znalosť relačných databáz a jazyka SQL.

Ďalšie údaje o knihe:

ISBN:9781839215001
Autor:
Vydavateľ:
Väzba:Mäkká väzba

Nákup:

Momentálne k dispozícii, na sklade.

Ďalšie knihy autora:

The Data Wrangling Workshop, druhé vydanie: Vytvorte si vlastné užitočné poznatky pomocou údajov z...
Príručka pre začiatočníkov, ako zjednodušiť...
The Data Wrangling Workshop, druhé vydanie: Vytvorte si vlastné užitočné poznatky pomocou údajov z viacerých nespracovaných zdrojov - The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources
Moderné dátové architektúry s Pythonom: Praktická príručka na vytváranie a nasadzovanie dátových...
Budovanie škálovateľných a spoľahlivých dátových...
Moderné dátové architektúry s Pythonom: Praktická príručka na vytváranie a nasadzovanie dátových potrubí, dátových skladov a dátových jazier pomocou jazyka Python - Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Diela autora vydali tieto vydavateľstvá:

© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)