Analyzing optimization landscape of recent policy optimization methods in deep RL

Analyzing optimization landscape of recent policy optimization methods in deep RL

This thesis is submitted in partial fulfillment of the requirements for the degree of Bachelor of Science in Computer Science, 2022.

Մատենագիտական մանրամասներ
Հիմնական հեղինակներ:	Khan, Mahir Asaf, Ashraf, Adib, Amin, Tahmid Adib
Այլ հեղինակներ:	Rashid, Warida
Ձևաչափ:	Թեզիս
Լեզու:	English
Հրապարակվել է:	Brac University 2023
Խորագրեր:	Optimization landscape Policy optimization Deep reinforcement learning Variance reduction Control variates Cognitive learning theory Machine learning
Առցանց հասանելիություն:	http://hdl.handle.net/10361/18306

Նմանատիպ նյութեր

Implementation of reinforcement learning architecture to augment an AI that can self-learn to play video games
: Mahmud, Aqil, և այլն
Հրապարակվել է: (2023)

ROBB: recurrent proximal policy optimization reinforcement learning for optimal block formation in bitcoin blockchain network
: Dutta, Amit
Հրապարակվել է: (2024)

Combinatorial optimization : algorithms and complexity /
: Papadimitriou, Christos H.
Հրապարակվել է: (1998)

Convex optimization /
: Boyd, Stephen P.
Հրապարակվել է: (2004)

Self-learning game bot using deep reinforcement learning
: Ananto, Azizul Haque
Հրապարակվել է: (2018)

Optimal energy rendering approach from lightning return stroke
: Chowdhury, A.S.M. Mishkat Hussain, և այլն
Հրապարակվել է: (2016)

Elements of dynamic optimization /
: Chiang, Alpha C., 1927-
Հրապարակվել է: (1992)

Elements of dynamic optimization /
: Chiang, Alpha C., 1927-
Հրապարակվել է: (2012)

Convex optimization /
: Boyd, Stephen P.
Հրապարակվել է: (1994)

Optimizing compilers for modern architectures : a dependence-based approach /
: Allen, Randy
Հրապարակվել է: (2001)

Implementation of real-time learning on homomorphically encrypted visual inputs
: Bhuiyan, Emtiaz MD Tafsir, և այլն
Հրապարակվել է: (2021)

Optimal capacitor placement in radial distribution system for loss minimization using particle swarm optimization
: Ismail, Abdiwahab Mohamed
Հրապարակվել է: (2024)

Early stage detection and classification of colon cancer using deep learning and explainable AI on histopathological images
: Hossain, Mainul, և այլն
Հրապարակվել է: (2022)

Character animation using reinforcement learning and imitation learning algorithms
: Tahmid, Tokey, և այլն
Հրապարակվել է: (2021)

Traﬃc congestion reduction in SUMO using reinforcement learning method
: Mouly, Radia Rahman, և այլն
Հրապարակվել է: (2021)

Skin cancer detection and classification using multiple optimized deep convolutional neural network
: Sakir, Adnan, և այլն
Հրապարակվել է: (2023)

Applied shape optimization for fluids
: Mohammadi, B.

Dynamic power management by reinforcement learning
: Hossain, Safayet, և այլն
Հրապարակվել է: (2016)

Accelerating ant colony optimization by using local search
: Tabassum, Nabila, և այլն
Հրապարակվել է: (2015)

Iterative Methods in Combinatorial Optimization
: Lap Chi Lau, R. Ravi, Mohit Singh
Հրապարակվել է: (2012)

Importance of educational data mining for optimized operations in Brac University
: Saad, Mohammad Alif Hossain
Հրապարակվել է: (2021)

How we learn and why we don't : student survival guide using the cognitive profile inventory /
: Krause, Lois Breur
Հրապարակվել է: (2008)

An efficient deep learning approach to detect skin Cancer
: Islam, Ashfaqul, և այլն
Հրապարակվել է: (2022)

Mechanism Design
: Rakesh V. Vohra
Հրապարակվել է: (2013)

Yoga posture recognition using the deep learning process
: Islam, Abidul, և այլն
Հրապարակվել է: (2023)

ShopUp: transforming business through product optimization
: Tamim, Farhad Hassan
Հրապարակվել է: (2018)

Reinforcement learning : an introduction /
: Sutton, Richard S., և այլն
Հրապարակվել է: (2018)

Resource optimization in cloud computing using dynamic load balancing technique
: Rafid, Mutasim, և այլն
Հրապարակվել է: (2021)

Reinforcement learning based electricity price forecasting in Blockchain based smart grid environment
: Moti, Md Mahraj Murshalin Al, և այլն
Հրապարակվել է: (2021)

Real-time mastitis detection in livestock using deep learning and machine learning leveraging edge devices
: Ghosh, Kawshik Kumar, և այլն
Հրապարակվել է: (2023)

A conventional & deep learning strategy for analyzing & detecting Bengali fake news in online medium
: Ahmed, Istiak, և այլն
Հրապարակվել է: (2023)

Classification of peripheral blood cell images using deep learning
: Aadi, Oyshik Ahmed, և այլն
Հրապարակվել է: (2024)

Importance of Search Engine Optimization (SEO) for businesses in Bangladesh
: Chishty, Wadud
Հրապարակվել է: (2018)

Essentials of learning : the new cognitive learning for students of education /
: Travers, Robert Morris William, 1913-

Resource-aware task scheduling by an adversarial bandit solver method in wireless sensor networks
: Khan, Muhidul Islam
Հրապարակվել է: (2016)

A modern technique to detect potholes by Computer Vision and Deep Learning
: Saif, Muntasir Mahmud, և այլն
Հրապարակվել է: (2023)

Corn leaf disease detection using deep convolution neural network
: Rabbi, Rawhatur, և այլն
Հրապարակվել է: (2023)

Prospect Theory
: Peter P. Wakker
Հրապարակվել է: (2012)

Method optimization for isolation of Klebsiella Bacteriophage from soil samples
: Khan, Zumana Hayat
Հրապարակվել է: (2021)

Reinforcement learning based autonomous vehicle for exploration and exploitation of undiscovered track
: Issa, Razin Bin, և այլն
Հրապարակվել է: (2020)