REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES

A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KRISHNAPPA, Madan, PATTANAYAK, Santanu, MUKHERJEE, Sanku, BANGALORE, Sanath Sreekanta, AGARWAL, Pankhuri, WARDHAN, Uttkarsh, GHORPADE, Vishal
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator KRISHNAPPA, Madan
PATTANAYAK, Santanu
MUKHERJEE, Sanku
BANGALORE, Sanath Sreekanta
AGARWAL, Pankhuri
WARDHAN, Uttkarsh
GHORPADE, Vishal
description A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function. Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2022093545A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2022093545A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2022093545A13</originalsourceid><addsrcrecordid>eNrjZHAIcvX0c_MPcnb1dfULUfBxdQzy8_RzV3ByDHZ1UQh29gCKKwDlFUJCweK-rr7-QZEKnn4hrkFujs6uwTwMrGmJOcWpvFCam0HZzTXE2UM3tSA_PrW4IDE5NS-1JD7c38jAyMjA0tjUxNTR0Jg4VQBfJCul</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><source>esp@cenet</source><creator>KRISHNAPPA, Madan ; PATTANAYAK, Santanu ; MUKHERJEE, Sanku ; BANGALORE, Sanath Sreekanta ; AGARWAL, Pankhuri ; WARDHAN, Uttkarsh ; GHORPADE, Vishal</creator><creatorcontrib>KRISHNAPPA, Madan ; PATTANAYAK, Santanu ; MUKHERJEE, Sanku ; BANGALORE, Sanath Sreekanta ; AGARWAL, Pankhuri ; WARDHAN, Uttkarsh ; GHORPADE, Vishal</creatorcontrib><description>A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function. Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; INFORMATION STORAGE ; PHYSICS ; STATIC STORES</subject><creationdate>2022</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220505&amp;DB=EPODOC&amp;CC=WO&amp;NR=2022093545A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25543,76294</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220505&amp;DB=EPODOC&amp;CC=WO&amp;NR=2022093545A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>KRISHNAPPA, Madan</creatorcontrib><creatorcontrib>PATTANAYAK, Santanu</creatorcontrib><creatorcontrib>MUKHERJEE, Sanku</creatorcontrib><creatorcontrib>BANGALORE, Sanath Sreekanta</creatorcontrib><creatorcontrib>AGARWAL, Pankhuri</creatorcontrib><creatorcontrib>WARDHAN, Uttkarsh</creatorcontrib><creatorcontrib>GHORPADE, Vishal</creatorcontrib><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><description>A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function. Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.</description><subject>CALCULATING</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>INFORMATION STORAGE</subject><subject>PHYSICS</subject><subject>STATIC STORES</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2022</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZHAIcvX0c_MPcnb1dfULUfBxdQzy8_RzV3ByDHZ1UQh29gCKKwDlFUJCweK-rr7-QZEKnn4hrkFujs6uwTwMrGmJOcWpvFCam0HZzTXE2UM3tSA_PrW4IDE5NS-1JD7c38jAyMjA0tjUxNTR0Jg4VQBfJCul</recordid><startdate>20220505</startdate><enddate>20220505</enddate><creator>KRISHNAPPA, Madan</creator><creator>PATTANAYAK, Santanu</creator><creator>MUKHERJEE, Sanku</creator><creator>BANGALORE, Sanath Sreekanta</creator><creator>AGARWAL, Pankhuri</creator><creator>WARDHAN, Uttkarsh</creator><creator>GHORPADE, Vishal</creator><scope>EVB</scope></search><sort><creationdate>20220505</creationdate><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><author>KRISHNAPPA, Madan ; PATTANAYAK, Santanu ; MUKHERJEE, Sanku ; BANGALORE, Sanath Sreekanta ; AGARWAL, Pankhuri ; WARDHAN, Uttkarsh ; GHORPADE, Vishal</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2022093545A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2022</creationdate><topic>CALCULATING</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>INFORMATION STORAGE</topic><topic>PHYSICS</topic><topic>STATIC STORES</topic><toplevel>online_resources</toplevel><creatorcontrib>KRISHNAPPA, Madan</creatorcontrib><creatorcontrib>PATTANAYAK, Santanu</creatorcontrib><creatorcontrib>MUKHERJEE, Sanku</creatorcontrib><creatorcontrib>BANGALORE, Sanath Sreekanta</creatorcontrib><creatorcontrib>AGARWAL, Pankhuri</creatorcontrib><creatorcontrib>WARDHAN, Uttkarsh</creatorcontrib><creatorcontrib>GHORPADE, Vishal</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>KRISHNAPPA, Madan</au><au>PATTANAYAK, Santanu</au><au>MUKHERJEE, Sanku</au><au>BANGALORE, Sanath Sreekanta</au><au>AGARWAL, Pankhuri</au><au>WARDHAN, Uttkarsh</au><au>GHORPADE, Vishal</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><date>2022-05-05</date><risdate>2022</risdate><abstract>A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function. Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2022093545A1
source esp@cenet
subjects CALCULATING
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
COMPUTING
COUNTING
INFORMATION STORAGE
PHYSICS
STATIC STORES
title REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-23T08%3A19%3A48IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=KRISHNAPPA,%20Madan&rft.date=2022-05-05&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2022093545A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true