Data-Efficient Reinforcement Learning using Semidefinite Programming

Masterarbeit

In diesem Projekt soll eine alternative Methodik für RL erforscht werden, indem konvexe Relaxationstechniken genutzt werden, um ein semidefinites Programmierproblem in Form von linearen Matrixungleichungen (LMIs) zu erhalten.

Hier erfahren Sie mehr (wird in neuem Tab geöffnet)