Risk-Sensitive Reinforcement Learning via Policy Gradient Search
Učenie s posilňovaním (Reinforcement learning - RL) je jedným zo základných pilierov umelej inteligencie a strojového učenia. Dôležitým faktorom v každom probléme optimalizácie alebo riadenia je pojem rizika, ale jeho začlenenie do RL bolo vyvinuté pomerne nedávno. V tejto monografii sa skúma výskum RL citlivého na riziko, ktorý využíva gradientové vyhľadávanie politiky.
Autori skúmajú niektoré z najnovších prác v tejto oblasti, konkrétne v prípadoch, keď je prístupom riešenia gradientné hľadanie politiky. V prvom prostredí RL citlivého na riziko sa zaoberajú populárnymi mierami rizika založenými na variancii, podmienenej hodnote v riziku a obmedzeniach náhody a predstavujú šablónu pre algoritmy RL citlivého na riziko založené na gradiente politiky, ktoré používajú Lagrangeovu formuláciu. Pre prostredie, kde je riziko zahrnuté priamo do účelovej funkcie, uvažujú exponenciálnu formuláciu užitočnosti, kumulatívnu teóriu vyhliadok a koherentné miery rizika.
Autori napísali text pre začiatočníkov aj odborníkov tak, aby bol úplne samostatný, ale zároveň bol organizovaný spôsobom, ktorý umožňuje odborným čitateľom preskočiť základné kapitoly. Ide o kompletnú príručku pre študentov a výskumníkov, ktorí sa zaoberajú týmto aspektom strojového učenia.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)