Data-Efficient Reinforcement Learning using Semidefinite Programming
Masterarbeit
In diesem Projekt soll eine alternative Methodik für RL erforscht werden, indem konvexe Relaxationstechniken genutzt werden, um ein semidefinites Programmierproblem in Form von linearen Matrixungleichungen (LMIs) zu erhalten.
(wird in neuem Tab geöffnet) Hier erfahren Sie mehr