Hodnotenie:
Kniha získala od používateľov zmes pozitívnych a negatívnych recenzií. Hoci mnohí čitatelia oceňujú jej pútavý obsah a praktické využitie zručností v oblasti R na príkladoch z reálneho života, boli zaznamenané významné technické problémy, najmä pokiaľ ide o jej prístupnosť na niektorých zariadeniach.
Výhody:** Vizuálne príťažlivé a príjemné čítanie. ** Bohaté vedomosti a dobre štruktúrované kapitoly. ** Rozširuje zručnosti v oblasti R zábavným a pútavým spôsobom. ** Zameriava sa na príklady z reálneho života, najmä na štatistiku baseballu. ** Vrelo odporúčaná na praktické učenie.
Nevýhody:** Časté pády na iPade, ktoré spôsobujú frustrujúce čítanie. ** Žiadny nastaviteľný text ani iné funkcie Kindle, ide o jednoduchú konverziu do PDF. ** Chýbajú niektoré údaje. ** Ťažkosti pri získavaní údajov potrebných na splnenie úloh.
(na základe 5 čitateľských recenzií)
Analyzing Baseball Data with R, Second Edition
Analýza baseballových dát s R Second Edition predstavuje R sabermetrikom, baseballovým nadšencom a študentom, ktorí majú záujem o skúmanie bohatstva baseballových dát. Vybaví vás potrebnými zručnosťami a softvérovými nástrojmi na vykonanie všetkých krokov analýzy, od importu údajov cez ich transformáciu do vhodného formátu až po vizualizáciu údajov prostredníctvom grafov a vykonanie štatistickej analýzy.
Autori najprv uvádzajú prehľad verejne dostupných bejzbalových dátových súborov a jemný úvod do typu dátových štruktúr a prieskumných možností a možností správy dát v programe R. Venujú sa aj grafickým funkciám ggplot2 a v celom texte používajú pracovný postup, ktorý je priateľský k tidyverse. Veľká časť knihy ilustruje použitie R prostredníctvom populárnych sabermetrických tém, vrátane Pytagorovho vzorca, očakávaného počtu behov, chytania, kariérnych trajektórií, simulácie zápasov a sezón, modelov pruhového správania hráčov a uhlov štartu a výstupných rýchlostí. Všetky súbory údajov a kód R použitý v texte sú k dispozícii online.
Novinkou v druhom vydaní je systematické používanie systému tidyverse a začlenenie údajov o sledovaní hráčov Statcast (sprístupnených spoločnosťou Baseball Savant). Všetky kódy z prvého vydania boli revidované podľa zásad tidyverse. V celej knihe sa kladie dôraz na balíky tidyverse vrátane dplyr, ggplot2, tidyr, purrr a broom. Dve úplne nové kapitoly sú umožnené vďaka dostupnosti údajov Statcast: jedna skúma pojem schopnosti chytača rámovať a druhá využíva štartovací uhol a výstupnú rýchlosť na odhad pravdepodobnosti homerunu. Prostredníctvom rôznych príkladov v knihe sa dozviete o modernej sabermetrii a o tom, ako vykonávať vlastné analýzy baseballu.
Max Marchi je analytikom bejzbalovej analýzy v klube Cleveland Indians. Pravidelne prispieval na webové stránky The Hardball Times a Baseball Prospectus a v minulosti bol konzultantom pre iné kluby MLB.
Jim Albert je zaslúžilý univerzitný profesor štatistiky na Bowling Green State University. Je autorom alebo spoluautorom niekoľkých kníh vrátane Curve Ball a Visualizing Baseball a bol redaktorom časopisu Journal of Quantitative Analysis of Sports.
Ben Baumer je docentom štatistiky a dátových vied na Smith College. Predtým pracoval ako štatistický analytik pre New York Mets a je spoluautorom The Sabermetric Revolution a Modern Data Science with R.
.