Details zu Publikationen

Verfahren und Vorrichtung zum Lernen einer Strategie und Betreiben der Strategie

verfasst von
Steven Adriaenssen, Andre Biedenkapp, Frank Hutter, Gresa Shala, Marius Lindauer, Noor Awad
Abstract

Verfahren (20) zum Lernen einer Strategie (π), welche zumindest einen Parameter (σ) eines Evolutionären Algorithmus optimal anpasst. Das Verfahren umfasst die folgenden Schritte: Initialisieren der Strategie, welche abhängig von Zustandsinformationen (S) eine Parametrisierung (A) des Parameters (σ) ermittelt. Erlernen der Strategie (π) mittels bestärkendem Lernen (engl. reinforcement learning), wobei aus Interaktionen des CMA-ES Algorithmus mit einer Parametrisierung, bestimmt mittels der Strategie abhängig von den Zustandsinformationen (S), mit einer Probleminstanz (14) und einem Belohnungssignal (R) gelernt wird, welche Parametrisierung für mögliche Zustandsinformationen optimal ist.

Organisationseinheit(en)
Fachgebiet Maschinelles Lernen
Typ
Patent
Publikationsdatum
27.01.2022
Publikationsstatus
Veröffentlicht