Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie
- authored by
- Steven Adriaenssen, Andre Biedenkapp, Frank Hutter, Gresa Shala, Marius Lindauer, Noor Awad
- Abstract
Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.
- Organisation(s)
-
Machine Learning Section
- Type
- Patent
- Publication date
- 27.01.2022
- Publication status
- Published