Analyzing optimization landscape of recent policy optimization methods in deep RL
This thesis is submitted in partial fulfillment of the requirements for the degree of Bachelor of Science in Computer Science, 2022.
المؤلفون الرئيسيون: | Khan, Mahir Asaf, Ashraf, Adib, Amin, Tahmid Adib |
---|---|
مؤلفون آخرون: | Rashid, Warida |
التنسيق: | أطروحة |
اللغة: | English |
منشور في: |
Brac University
2023
|
الموضوعات: | |
الوصول للمادة أونلاين: | http://hdl.handle.net/10361/18306 |
مواد مشابهة
-
Implementation of reinforcement learning architecture to augment an AI that can self-learn to play video games
بواسطة: Mahmud, Aqil, وآخرون
منشور في: (2023) -
ROBB: recurrent proximal policy optimization reinforcement learning for optimal block formation in bitcoin blockchain network
بواسطة: Dutta, Amit
منشور في: (2024) -
Combinatorial optimization : algorithms and complexity /
بواسطة: Papadimitriou, Christos H.
منشور في: (1998) -
Convex optimization /
بواسطة: Boyd, Stephen P.
منشور في: (2004) -
Self-learning game bot using deep reinforcement learning
بواسطة: Ananto, Azizul Haque
منشور في: (2018)