Multi-Armed Bandits - Theory and Applications to Online Learning in Networks
Problémy viacnásobného banditu sa týkajú optimálneho sekvenčného rozhodovania a učenia v neznámom prostredí. Od prvého banditovského problému, ktorý položil Thompson v roku 1933 pre aplikáciu klinických skúšok, sa banditovské problémy tešia trvalej pozornosti viacerých výskumných komunít a našli širokú škálu aplikácií v rôznych oblastiach.
Táto kniha zahŕňa klasické výsledky a najnovší vývoj v oblasti bayesovských aj frekvenčných banditových problémov. V kapitole 1 začíname stručným prehľadom histórie banditovských problémov, porovnávame dve školy - bayesovský a frekvenčný - prístup a zdôrazňujeme základné výsledky a kľúčové aplikácie. Kapitoly 2 a 4 sa zaoberajú kanonickým bayesovským a frekvenčným banditským modelom.
V kapitolách 3 a 5 rozoberáme hlavné varianty kanonických banditovských modelov, ktoré vedú k novým smerom, prinášajú nové techniky a rozširujú aplikácie tohto klasického problému. V kapitole 6 uvádzame niekoľko reprezentatívnych príkladov aplikácií v komunikačných sieťach a sociálno-ekonomických systémoch s cieľom objasniť súvislosti medzi bayesovskými a frekvenčnými formuláciami banditských problémov a to, ako možno využiť štrukturálne výsledky týkajúce sa jedného z nich na získanie riešení podľa druhého.
© Book1 Group - všetky práva vyhradené.
Obsah tejto stránky nesmie byť kopírovaný ani použitý čiastočne alebo v celku bez písomného súhlasu vlastníka.
Posledná úprava: 2024.11.13 22:11 (GMT)