Hodnotenie:
Knihu odporúčame všetkým, ktorí sa zaoberajú aplikovaným posilňovaním učenia (RL), pretože ponúka praktickú príručku s príkladmi z praxe a modernými metódami. Hoci je dobre napísaná a pokrýva širokú škálu tém od základov až po pokročilé aplikácie, nie je vhodná pre úplných začiatočníkov a vyžaduje si určité znalosti štatistiky, pravdepodobnosti a programovania v jazyku Python. Formátovanie a prezentácia knihy však boli podrobené kritike.
Výhody:⬤ Skvelý priebeh a jednoduché sledovanie spolu s kódmi v jazyku Python.
⬤ Praktická príručka s príkladmi a aplikáciami z reálneho sveta.
⬤ Pokrýva širokú škálu tém RL vrátane pokročilých konceptov.
⬤ Poskytuje externé zdroje na hlbšie pochopenie.
⬤ Vhodný pre stredne pokročilých používateľov a odborníkov z praxe, ktorí plánujú implementovať RL riešenia.
⬤ Nie je pre úplných začiatočníkov; vyžaduje predchádzajúce znalosti štatistiky, pravdepodobnosti a určité programátorské zručnosti v jazyku Python.
⬤ Slabé formátovanie a kvalita prezentácie s problémami, ako je nekonzistentné písanie pomlčiek a rozmazané obrázky.
(na základe 13 čitateľských recenzií)
Mastering Reinforcement Learning with Python: Build next-generation, self-learning models using reinforcement learning techniques and best practices
Získajte praktické skúsenosti s vytváraním najmodernejších agentov posilňovania učenia pomocou TensorFlow a RLlib na riešenie zložitých reálnych obchodných a priemyselných problémov s pomocou odborných tipov a osvedčených postupov
Kľúčové vlastnosti:
⬤ Pochopte, ako fungujú rozsiahle najmodernejšie algoritmy a prístupy RL.
⬤ Aplikujte RL na riešenie komplexných problémov v marketingu, robotike, dodávateľskom reťazci, financiách, kybernetickej bezpečnosti a ďalších.
⬤ Preskúmajte tipy a osvedčené postupy od odborníkov, ktoré vám umožnia prekonať problémy v reálnom svete RL.
Popis knihy:
Posilňovacie učenie (RL) je oblasť umelej inteligencie (AI), ktorá sa používa na vytváranie samoučiacich sa autonómnych agentov. Táto kniha stavia na silnom teoretickom základe, využíva praktický prístup a na príkladoch inšpirovaných skutočnými problémami v priemysle vás oboznámi s najmodernejším RL.
Kniha začína problémami banditov, Markovovými rozhodovacími procesmi a dynamickým programovaním a poskytuje podrobný prehľad klasických techník RL, ako sú metódy Monte Carlo a učenie s časovou diferenciou. Potom sa dozviete o hĺbkovom Q-učení, algoritmoch gradientu politiky, metódach aktér-kritik, metódach založených na modeli a posilňovacom učení viacerých agentov. Potom sa zoznámite s niektorými kľúčovými prístupmi, ktoré stoja za najúspešnejšími implementáciami RL, ako je doménová randomizácia a učenie založené na zvedavosti.
Ako budete postupovať, preskúmate mnohé nové algoritmy s pokročilými implementáciami pomocou moderných knižníc jazyka Python, ako sú TensorFlow a balík Ray RLlib. Zistíte tiež, ako implementovať RL v oblastiach, ako sú robotika, riadenie dodávateľského reťazca, marketing, financie, inteligentné mestá a kybernetická bezpečnosť, pričom budete posudzovať kompromisy medzi rôznymi prístupmi a vyhýbať sa bežným nástrahám.
Na konci tejto knihy budete ovládať spôsob, ako trénovať a nasadzovať vlastných RL agentov na riešenie RL problémov.
Čo sa naučíte:
⬤ Modelovať a riešiť zložité sekvenčné rozhodovacie problémy pomocou RL.
⬤ Dobre pochopiť, ako fungujú najmodernejšie metódy RL.
⬤ Používajte Python a TensorFlow na kódovanie algoritmov RL od začiatku.
⬤ Paralelizujte a škálujte svoje implementácie RL pomocou balíka Ray RLlib.
⬤ Získajte hlboké znalosti o širokej škále tém RL.
⬤ Pochopiť kompromisy medzi rôznymi prístupmi RL.
⬤ Objaviť a riešiť problémy spojené s implementáciou RL v reálnom svete.
Pre koho je táto kniha určená:
Táto kniha je určená odborníkom v oblasti strojového učenia a výskumníkom, ktorí sa chcú zamerať na praktické posilňovanie učenia s jazykom Python implementáciou pokročilých konceptov hlbokého posilňovania učenia v reálnych projektoch. Táto kniha bude užitočná aj pre odborníkov na posilňovanie učenia, ktorí chcú prehĺbiť svoje znalosti, aby mohli riešiť rozsiahle a zložité problémy sekvenčného rozhodovania. Vyžadujú sa pracovné znalosti programovania v jazyku Python a hlbokého učenia spolu s predchádzajúcimi skúsenosťami s posilňovacím učením.