DEEP- REINFORCEMENT LEARNING (RL), WEIGHT-RESONANT SYSTEM AND METHOD FOR FIXED-HORIZON SEARCH OF OPTIMALITY
According to embodiments, a neural network running on at least one processor receives a constant input for a configuration design requiring N dimensions. The neural network outputs N probability distributions. The at least one processor generates a batch of sample configurations for the configuratio...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | According to embodiments, a neural network running on at least one processor receives a constant input for a configuration design requiring N dimensions. The neural network outputs N probability distributions. The at least one processor generates a batch of sample configurations for the configuration design based on the N probability distributions. Each sample configuration of the batch of sample configurations corresponds to a different full configuration of a system. The at least one processor outputs the batch of sample configurations to an evaluator external to the neural network. The at least one processor updates parameters of the neural network based on a loss function.
Selon des modes de réalisation de l'invention, un réseau neuronal fonctionnant sur au moins un processeur reçoit une entrée constante pour une conception de configuration nécessitant N dimensions. Le réseau neuronal délivre N distributions de probabilité. Le ou les processeurs génèrent un lot de configurations d'échantillon pour la conception de configuration sur la base des N distributions de probabilité. Chaque configuration d'échantillon du lot de configurations d'échantillon correspond à une configuration complète différente d'un système. Le ou les processeurs délivrent en sortie le lot de configurations d'échantillon à un évaluateur externe au réseau neuronal. Le ou les processeurs mettent à jour des paramètres du réseau neuronal sur la base d'une fonction de perte. |
---|