Hodnotenie:
Momentálne nie sú žiadne recenzie čitateľov. Hodnotenie je založené na 12 hlasoch.
Deep Reinforcement Learning with Python: With Pytorch, Tensorflow and Openai Gym
Hlboké posilňovacie učenie je rýchlo sa rozvíjajúca disciplína, ktorá má významný vplyv na oblasti autonómnych vozidiel, robotiky, zdravotníctva, financií a mnohých ďalších. Táto kniha sa zaoberá hlbokým posilňovaním učenia pomocou hlbokého učenia a modelov gradientu politiky s cvičením kódovania.
Začnete prehľadom Markovových rozhodovacích procesov, Bellmanových rovníc a dynamického programovania, ktoré tvoria základné pojmy a základy hlbokého posilňovania učenia. Ďalej budete študovať učenie bez modelu, po ktorom bude nasledovať aproximácia funkcií pomocou neurónových sietí a hlboké učenie. Potom nasledujú rôzne algoritmy hlbokého posilňovacieho učenia, ako sú hlboké q-siete, rôzne príchute metód aktér-kritik a iné metódy založené na politikách.
Pozriete sa aj na dilemu prieskum vs. využívanie, ktorá je kľúčovým faktorom v algoritmoch posilňovania učenia, spolu s vyhľadávaním stromov Monte Carlo (MCTS), ktoré zohralo kľúčovú úlohu pri úspechu AlphaGo. Záverečné kapitoly sa venujú implementácii hlbokého posilňovania pomocou populárnych rámcov hlbokého učenia, ako sú TensorFlow a PyTorch. Na záver pochopíte hlboké posilňovacie učenie spolu s implementáciou hlbokých q sietí a modelov gradientu politiky pomocou TensorFlow, PyTorch a Open AI Gym.
Čo sa naučíte
⬤ Preskúmajte hlboké posilňovacie učenie.
⬤ Implementovať algoritmy hlbokého učenia pomocou prostredia OpenAI Gym.
⬤ Kódovať vlastných herných agentov pre Atari pomocou algoritmov actor-critic.
⬤ Používajte osvedčené postupy na tvorbu modelov a trénovanie algoritmov.
Pre koho je táto kniha určená
Vývojárom a architektom strojového učenia, ktorí chcú mať náskok v oblasti umelej inteligencie a hlbokého učenia.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)