Analyzing optimization landscape of recent policy optimization methods in deep RL
This thesis is submitted in partial fulfillment of the requirements for the degree of Bachelor of Science in Computer Science, 2022.
Những tác giả chính: | Khan, Mahir Asaf, Ashraf, Adib, Amin, Tahmid Adib |
---|---|
Tác giả khác: | Rashid, Warida |
Định dạng: | Luận văn |
Ngôn ngữ: | English |
Được phát hành: |
Brac University
2023
|
Những chủ đề: | |
Truy cập trực tuyến: | http://hdl.handle.net/10361/18306 |
Những quyển sách tương tự
-
Implementation of reinforcement learning architecture to augment an AI that can self-learn to play video games
Bằng: Mahmud, Aqil, et al.
Được phát hành: (2023) -
ROBB: recurrent proximal policy optimization reinforcement learning for optimal block formation in bitcoin blockchain network
Bằng: Dutta, Amit
Được phát hành: (2024) -
Combinatorial optimization : algorithms and complexity /
Bằng: Papadimitriou, Christos H.
Được phát hành: (1998) -
Convex optimization /
Bằng: Boyd, Stephen P.
Được phát hành: (2004) -
Self-learning game bot using deep reinforcement learning
Bằng: Ananto, Azizul Haque
Được phát hành: (2018)