Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 3 hlasoch.
Practical Data Science with Python 3: Synthesizing Actionable Insights from Data
Kapitola 1. Úvod do dátovej vedyČíslo strán: Táto kapitola uvádza čitateľa do vedy o údajoch a opisuje hlavné fázy práce s údajmi (zber, skúmanie, predbežné spracovanie, vizualizácia, predpovedanie a odvodzovanie poznatkov). Stanovuje spoločné očakávania, čo tvorí oblasť dátovej vedy. V tejto kapitole sa podrobne hovorí o prostredí Anaconda IDE, ktoré sa bude v knihe používať.
Kapitola 2. Získavanie údajovPočet strán: Táto kapitola čitateľa oboznámi s tým, ako získavať a ukladať údaje z/do rôznych zdrojov údajov: textové súbory (vrátane rôznych formátov, ako sú CSV, XML a JSON), binárne súbory (vrátane Apache Avro), údaje dostupné na webe, relačné databázy, databázy NoSQL, Apache Arrow (ako efektívny a nový systém ukladania stĺpcových údajov), multimodálne databázy a sieťové databázy. V tejto kapitole sa tiež predstaví BeautifulSoup na prácu s XML a HTML.
Kapitola 3. Základné spracovanie údajovPočet strán: Sú to štandardné knižnice jazyka Python na vedecké výpočty a spracovanie údajov. NumPy zahŕňa všetky druhy dátových štruktúr potrebných pri analýze údajov. Uvedieme tu príklady, ktoré osvetlia význam sofistikovaných rámcov a softvérového inžinierstva založeného na opakovanom použití v oblasti vedy o údajoch.
Kapitola 4. Dokumentácia práceČíslo strán: 20Táto kapitola predstavuje najpopulárnejšie počítačové prostredie na analýzu údajov. Umožňuje zdieľanie výsledkov medzi dátovými vedcami ľahko reprodukovateľným spôsobom.
Kapitola 5. Transformácia a balenie údajovČíslo strán: 30Táto kapitola objasňuje kritický rámec dátovej vedy, ktorý je postavený na NumPy. Poskytuje vynikajúce dátové štruktúry na spracovanie dátových rámcov a radov.
Kapitola 6. VizualizáciaPočet strán: Táto kapitola predstavuje rôzne spôsoby vizualizácie údajov; súhrnné štatistiky alebo tabuľkové reprezentácie majú pri skúmaní údajov obmedzenú hodnotu. Témou tejto kapitoly budú tieto rámce: matplotlib, glueviz, Bokeh a orange3. Vizualizácia je dôležitá pri prieskumnej analýze, ako aj pri vytváraní efektívnych správ.
Kapitola 7. Predpovedanie a odvodzovaniePočet strán: V tejto kapitole sa bude hovoriť o všetkých technikách a technológiách na správne škálovanie úsilia v oblasti vedy o údajoch. Naučí čitateľov, ako vytvárať systémy, ktoré môžu formulovať odpovede na neviditeľné údaje alebo nájsť skryté vzory v údajoch. Podrobne sa bude venovať metódam učenia pod dohľadom, bez dohľadu, hlbokého učenia a posilňovania. Okrem toho predstaví Apache Spark s MLib (v dávkovom aj prúdovom režime), ako aj TensorFlow. Témou tejto kapitoly budú aj nasledujúce rámce: XGBoost, sci-kit learn a Keras s PyTorch.
Kapitola 8. Sieťová analýzaPočet strán: 1: Táto kapitola sa zaoberá spôsobmi analýzy zložitých sietí a grafov. V tejto kapitole sa predstavia Apache Spark GraphX, Apache Giraph a NetworkX. Táto kapitola tiež predstaví spektrálnu analýzu grafov, ktorá je zaujímavou približnou, nelineárnou a neparametrickou metódou strojového učenia.
Kapitola 9. Procesné inžinierstvo dátovej vedyPočet strán: 1: V tejto kapitole bude rozpracované, ako zdieľať a prispôsobovať postupy/metódy dátovej vedy používané tímami prostredníctvom OMG Essence.
Kapitola 10. Multi-agentové systémy, teória hier a strojové učeniePočet strán: Táto kapitola sa zaoberá pokročilými aplikáciami orientovanými na údaje, v ktorých sú údaje vytvárané a využívané samosprávnymi inteligentnými agentmi. Kapitola oboznamuje čitateľa s koncepciou multiagentových systémov, metódami a modelmi teórie hier, ako aj s príslušnými algoritmami učenia.
Kapitola 11. Pravdepodobnostné grafické modelyNumbe.