Hodnotenie:
Kniha ponúka kombináciu akademických poznatkov a praktických aplikácií posilňovania učenia. Trpí však závažnými preklepmi, nevyhovujúcou kvalitou tlače a chýba jej jasnosť, pokiaľ ide o cieľovú skupinu. Mnohí recenzenti ju považovali za príliš akademickú pre začiatočníkov a nedostatočne praktickú pre priame použitie v priemysle.
Výhody:Skvelá kombinácia akademického a priemyselného prostredia, užitočné poznatky pre praktické prípady použitia, dobre prijatý stav pri dodaní.
Nevýhody:Závažné preklepy v centrálnych rovniciach, neštandardná kvalita čiernobielej tlače, nejasná cieľová skupina, chýba dostatočná zrozumiteľnosť a praktickosť, príliš akademická pre začiatočníkov.
(na základe 5 čitateľských recenzií)
Reinforcement Learning: Industrial Applications of Intelligent Agents
Posilňovacie učenie (Reinforcement learning - RL) bude v nasledujúcom desaťročí predstavovať jeden z najväčších prielomov v oblasti umelej inteligencie, pretože umožní algoritmom učiť sa z prostredia a dosahovať ľubovoľné ciele. Tento vzrušujúci vývoj umožňuje vyhnúť sa obmedzeniam, ktoré sa vyskytujú v tradičných algoritmoch strojového učenia (ML). Táto praktická kniha ukazuje profesionálom v oblasti dátovej vedy a umelej inteligencie, ako sa učiť posilňovaním a umožniť stroju, aby sa učil sám.
Autor Phil Winder zo spoločnosti Winder Research pokrýva všetko od základných stavebných prvkov až po najmodernejšie postupy. Preskúmate súčasný stav RL, zameriate sa na priemyselné aplikácie, naučíte sa množstvo algoritmov a využijete špecializované kapitoly o nasadení RL riešení do výroby. Nie je to žiadna kuchárska kniha; nevyhýba sa matematike a očakáva znalosť ML.
⬤ Zistite, čo je RL a ako algoritmy pomáhajú riešiť problémy.
⬤ Získajte základy RL vrátane Markovových rozhodovacích procesov, dynamického programovania a učenia pomocou časových rozdielov.
⬤ Ponorte sa hlbšie do celého radu metód gradientu hodnôt a politík.
⬤ Aplikujte pokročilé riešenia RL, ako je meta učenie, hierarchické učenie, učenie viacerých agentov a imitačné učenie.
⬤ Poznajte špičkové algoritmy hlbokého RL vrátane Rainbow, PPO, TD3, SAC a ďalších.
⬤ Získajte praktické príklady prostredníctvom sprievodnej webovej stránky.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)