Analyzing optimization landscape of recent policy optimization methods in deep RL
This thesis is submitted in partial fulfillment of the requirements for the degree of Bachelor of Science in Computer Science, 2022.
Հիմնական հեղինակներ: | Khan, Mahir Asaf, Ashraf, Adib, Amin, Tahmid Adib |
---|---|
Այլ հեղինակներ: | Rashid, Warida |
Ձևաչափ: | Թեզիս |
Լեզու: | English |
Հրապարակվել է: |
Brac University
2023
|
Խորագրեր: | |
Առցանց հասանելիություն: | http://hdl.handle.net/10361/18306 |
Նմանատիպ նյութեր
-
Implementation of reinforcement learning architecture to augment an AI that can self-learn to play video games
: Mahmud, Aqil, և այլն
Հրապարակվել է: (2023) -
ROBB: recurrent proximal policy optimization reinforcement learning for optimal block formation in bitcoin blockchain network
: Dutta, Amit
Հրապարակվել է: (2024) -
Combinatorial optimization : algorithms and complexity /
: Papadimitriou, Christos H.
Հրապարակվել է: (1998) -
Convex optimization /
: Boyd, Stephen P.
Հրապարակվել է: (2004) -
Self-learning game bot using deep reinforcement learning
: Ananto, Azizul Haque
Հրապարակվել է: (2018)