Hodnotenie:
Druhé vydanie knihy „Deep Reinforcement Learning with Python“ je všeobecne oceňované pre svoju zrozumiteľnosť, komplexné pokrytie konceptov reinforcement learningu a praktické príklady kódovania s využitím TensorFlow 2.0 a OpenAI Gym. Niektorí čitatelia ju však považujú za zastaranú, pokiaľ ide o jej softvérové závislosti, a za frustrujúcu kvôli nedostatočnému vysvetleniu pojmov v niektorých príkladoch.
Výhody:⬤ Jasné vysvetlenia a postupný tok konceptov od základných k pokročilým témam RL.
⬤ Praktické cvičenia s využitím TensorFlow
⬤ 0 a OpenAI Gym, ktoré podporujú praktické učenie.
⬤ Veľmi podrobné a komplexné pokrytie širokej škály algoritmov posilňovania učenia.
⬤ Vizuálne ilustrácie zlepšujú porozumenie.
⬤ Výrazné zlepšenie oproti prvému vydaniu vrátane podrobných matematických vysvetlení.
⬤ Niektorý obsah sa môže zdať zastaraný, najmä kvôli spoliehaniu sa na TensorFlow
⬤ x pri niektorých príkladoch.
⬤ Nedostatok podrobných vysvetlení v niektorých príkladoch, čo vedie k nejasnostiam v súvislosti s odôvodnením konkrétnych rozhodnutí.
⬤ Kniha je rozsiahla (700 strán), čo niektorí čitatelia považujú za ohromujúce a môžu navrhnúť rozdelenie na verziu pre začiatočníkov a pokročilých.
⬤ Inštalačné pokyny pre kódové prostredie považujú niektorí používatelia za nedostatočné.
(na základe 21 čitateľských recenzií)
Deep Reinforcement Learning with Python - Second Edition
Sprievodca bohatý na príklady pre začiatočníkov, ktorí chcú začať svoju cestu posilňovania a hlbokého posilňovania pomocou najmodernejších odlišných algoritmov
Kľúčové vlastnosti
⬤ Pokrýva široké spektrum základných až pokročilých algoritmov RL s matematickým vysvetlením každého algoritmu.
⬤ Učte sa implementovať algoritmy pomocou kódu na základe príkladov s vysvetlením riadok po riadku.
⬤ Preskúmajte najnovšie metodiky RL, ako sú DDPG, PPO a využitie expertných ukážok.
Popis knihy
Vzhľadom na výrazné zlepšenie kvality a kvantity algoritmov v posledných rokoch bolo toto druhé vydanie knihy Hands-On Reinforcement Learning with Python prepracované do podoby príručky bohatej na príklady na učenie najmodernejších algoritmov reinforcement learningu (RL) a deep RL pomocou TensorFlow 2 a sady nástrojov OpenAI Gym.
Okrem základov RL a základných pojmov, ako sú Bellmanova rovnica, Markovove rozhodovacie procesy a algoritmy dynamického programovania, sa toto druhé vydanie venuje celému spektru metód RL založených na hodnotách, politikách a kritike aktérov. Podrobne skúma najmodernejšie algoritmy, ako sú DQN, TRPO, PPO a ACKTR, DDPG, TD3 a SAC, pričom demystifikuje základnú matematiku a demonštruje implementácie na jednoduchých príkladoch kódu.
Kniha obsahuje niekoľko nových kapitol venovaných novým technikám RL vrátane distribučného RL, imitačného učenia, inverzného RL a meta RL. Naučíte sa využívať stabilné východiská, vylepšenie knižnice východísk OpenAI, na bezproblémovú implementáciu populárnych algoritmov RL. Knihu uzatvára prehľad sľubných prístupov, ako je metaučenie a predstavivosť rozšírených agentov vo výskume.
Na konci získate zručnosti v efektívnom využívaní RL a hlbokého RL vo svojich reálnych projektoch.
Čo sa naučíte
⬤ Pochopiť základné koncepty RL vrátane metodík, matematiky a kódu.
⬤ Vycvičiť agenta na riešenie Blackjacku, FrozenLake a mnohých ďalších problémov pomocou OpenAI Gym.
⬤ Vycvičiť agenta na hranie hry Ms Pac-Man pomocou siete Deep Q.
⬤ Oboznámte sa s metódami založenými na politikách, hodnotách a kritike aktérov.
⬤ Ovládnite matematické metódy DDPG, TD3, TRPO, PPO a mnohé ďalšie.
⬤ Preskúmajte nové cesty, ako je distribučná RL, meta RL a inverzná RL.
⬤ Využite stabilné východiská na trénovanie agenta, aby chodil a hral Atari hry.
Pre koho je táto kniha určená
Ak ste vývojár strojového učenia s malými alebo žiadnymi skúsenosťami s neurónovými sieťami, ktorý sa zaujíma o umelú inteligenciu a chce sa naučiť o posilňovaní učenia od základov, táto kniha je pre vás.
Vyžaduje sa základná znalosť lineárnej algebry, kalkulu a programovacieho jazyka Python. Určité skúsenosti s TensorFlow by boli výhodou.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)