Analyzing optimization landscape of recent policy optimization methods in deep RL
This thesis is submitted in partial fulfillment of the requirements for the degree of Bachelor of Science in Computer Science, 2022.
Main Authors: | Khan, Mahir Asaf, Ashraf, Adib, Amin, Tahmid Adib |
---|---|
מחברים אחרים: | Rashid, Warida |
פורמט: | Thesis |
שפה: | English |
יצא לאור: |
Brac University
2023
|
נושאים: | |
גישה מקוונת: | http://hdl.handle.net/10361/18306 |
פריטים דומים
-
Implementation of reinforcement learning architecture to augment an AI that can self-learn to play video games
מאת: Mahmud, Aqil, et al.
יצא לאור: (2023) -
ROBB: recurrent proximal policy optimization reinforcement learning for optimal block formation in bitcoin blockchain network
מאת: Dutta, Amit
יצא לאור: (2024) -
Combinatorial optimization : algorithms and complexity /
מאת: Papadimitriou, Christos H.
יצא לאור: (1998) -
Convex optimization /
מאת: Boyd, Stephen P.
יצא לאור: (2004) -
Self-learning game bot using deep reinforcement learning
מאת: Ananto, Azizul Haque
יצא לאור: (2018)