Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 33 hlasoch.
Zjednodušte si procesy ETL pomocou týchto praktických tipov, trikov a osvedčených postupov v oblasti hygieny údajov. Kľúčové vlastnosti Zamerajte sa na základy spracovania údajov Preštudujte si rôzne spôsoby, ako získať čo najviac z vašich údajov za kratší čas Zvýšte si úroveň vzdelávania pomocou bonusových tém, ako je náhodné generovanie údajov a kontrola integrity údajov Popis knihy
Aby boli údaje užitočné a zmysluplné, musia byť kultivované a vylepšené. Kniha Data Wrangling with Python vás naučí základné myšlienky týchto procesov a vybaví vás znalosťami najpopulárnejších nástrojov a techník v tejto oblasti.
Kniha začína úplnými základmi jazyka Python, pričom sa zameriava najmä na dátové štruktúry. Potom sa venuje základným nástrojom na prácu s údajmi, ako sú knižnice NumPy a Pandas. Spoznáte užitočné poznatky o tom, prečo by ste sa mali držať ďalej od tradičných spôsobov čistenia údajov, ako sa to robí v iných jazykoch, a využiť špecializované predpripravené procedúry v jazyku Python. Táto kombinácia tipov a trikov v jazyku Python vám tiež ukáže, ako používať rovnaký backend jazyka Python a získavať/transformovať údaje z celého radu zdrojov vrátane internetu, veľkých databázových trezorov a finančných tabuliek programu Excel. Aby ste sa mohli pripraviť na náročnejšie scenáre, budete sa zaoberať tým, ako spracovať chýbajúce alebo nesprávne údaje a preformátovať ich na základe požiadaviek z nadväzujúceho analytického nástroja. Kniha vám ďalej pomôže pochopiť koncepty prostredníctvom reálnych príkladov a súborov údajov.
Na konci tejto knihy si budete istí, že dokážete používať rôznorodé zdroje na efektívne získavanie, čistenie, transformáciu a formátovanie údajov. Čo sa naučíte Používať a manipulovať so zložitými a jednoduchými dátovými štruktúrami Využívať plný potenciál DataFrames a numpy. array at run time Vykonávať web scraping pomocou BeautifulSoup4 a html5lib Vykonávať pokročilé vyhľadávanie a manipuláciu s reťazcami pomocou RegEX Spracovávať odľahlé hodnoty a vykonávať imputáciu údajov pomocou Pandas Používať deskriptívnu štatistiku a techniky vykresľovania Praktické spracovanie údajov a modelovanie pomocou techník generovania údajov Komu je táto kniha určená
Kniha Data Wrangling with Python je určená pre vývojárov, dátových analytikov a biznis analytikov, ktorí sa chcú venovať kariére plnohodnotného dátového vedca alebo analytika. Hoci je táto kniha určená pre začiatočníkov, na ľahké pochopenie tu uvedených konceptov sú potrebné predchádzajúce pracovné znalosti jazyka Python. Pomôže aj základná znalosť relačnej databázy a jazyka SQL. Obsah Úvod do spracovania údajov pomocou jazyka Python Pokročilé dátové štruktúry a práca so súbormi Úvod do Numpy, Pandas a Matplotlib Hlboký ponor do spracovania údajov pomocou jazyka Python Pohodlné narábanie s rôznymi druhmi zdrojov údajov Spoznávanie skrytých tajomstiev spracovania údajov Pokročilé škrabanie z webu a zber údajov RDBMS a SQL Aplikácia spracovania údajov v reálnom živote