Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie
- verfasst von
- Steven Adriaenssen, Andre Biedenkapp, Frank Hutter, Gresa Shala, Marius Lindauer, Noor Awad
- Abstract
Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.
- Organisationseinheit(en)
-
Fachgebiet Maschinelles Lernen
- Typ
- Patent
- Publikationsdatum
- 27.01.2022
- Publikationsstatus
- Veröffentlicht