Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 9 hlasoch.
Pandas for Everyone: Python Data Analysis
Praktický úvod do analýzy údajov Pandas v jazyku Python
Analytici dnes musia spravovať údaje, ktoré sa vyznačujú mimoriadnou rozmanitosťou, rýchlosťou a objemom. Pomocou knižnice Pandas s otvoreným zdrojovým kódom môžete v jazyku Python rýchlo automatizovať a vykonávať prakticky akúkoľvek úlohu analýzy údajov, bez ohľadu na to, aká je rozsiahla alebo zložitá. Pandas vám pomôže zabezpečiť pravdivosť údajov, vizualizovať ich na efektívne rozhodovanie a spoľahlivo reprodukovať analýzy vo viacerých súboroch údajov.
Pandas pre každého prináša praktické znalosti a poznatky na riešenie skutočných problémov s Pandas, aj keď ste v analýze údajov v jazyku Python nováčik. Daniel Y. Chen predstavuje kľúčové koncepty prostredníctvom jednoduchých, ale praktických príkladov a postupne na nich stavia riešenie zložitejších, reálnych problémov.
Chen vám poskytne úvodné informácie o používaní programu Pandas s reálnym súborom údajov a zaoberá sa kombinovaním súborov údajov, spracovaním chýbajúcich údajov a štruktúrovaním súborov údajov na jednoduchšiu analýzu a vizualizáciu. Demonštruje výkonné techniky čistenia údajov, od základnej manipulácie s reťazcami až po súčasné použitie funkcií v dátových rámcoch.
Keď sú vaše údaje pripravené, Chen vás prevedie nastavením modelov na predikciu, zhlukovanie, odvodzovanie a skúmanie. Poskytne vám tipy týkajúce sa výkonu a škálovateľnosti a predstaví vám širší ekosystém analýzy údajov v jazyku Python.
⬤ Pracujte s DataFrames a Series a importujte alebo exportujte údajeVytvárajte grafy pomocou matplotlib, seaborn a pandas.
⬤ Skombinujte súbory údajov a spracujte chýbajúce údaje.
⬤ Tvarujte, upravujte a čistite súbory údajov, aby sa s nimi ľahšie pracovalo.
⬤ Konverzia dátových typov a manipulácia s textovými reťazcami.
⬤ Používajte funkcie na škálovanie manipulácie s údajmi.
⬤ Agregovať, transformovať a filtrovať veľké súbory údajov pomocou funkcie groupby.
⬤ Využívajte pokročilé možnosti programu Pandas týkajúce sa dátumu a času.
⬤ Fitovať lineárne modely pomocou knižníc statsmodels a scikit-learn.
⬤ Používajte zovšeobecnené lineárne modelovanie na fitovanie modelov s rôznymi premennými odpovedí.
⬤ Porovnávanie viacerých modelov a výber najlepšieho.
⬤ Regulujte na prekonanie nadmerného prispôsobenia a zlepšenie výkonu.
⬤ Používajte zhlukovanie v strojovom učení bez dozoru.
⬤ .
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)