REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES

A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device....

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	KRISHNAPPA, Madan, PATTANAYAK, Santanu, MUKHERJEE, Sanku, BANGALORE, Sanath Sreekanta, AGARWAL, Pankhuri, WARDHAN, Uttkarsh, GHORPADE, Vishal
Format:	Patent
Sprache:	eng ; fre
Schlagworte:	CALCULATING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING INFORMATION STORAGE PHYSICS STATIC STORES
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function. Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.