REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES
A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device....
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | |
---|---|
container_issue | |
container_start_page | |
container_title | |
container_volume | |
creator | KRISHNAPPA, Madan PATTANAYAK, Santanu MUKHERJEE, Sanku BANGALORE, Sanath Sreekanta AGARWAL, Pankhuri WARDHAN, Uttkarsh GHORPADE, Vishal |
description | A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function.
Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense. |
format | Patent |
fullrecord | <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2022093545A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2022093545A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2022093545A13</originalsourceid><addsrcrecordid>eNrjZHAIcvX0c_MPcnb1dfULUfBxdQzy8_RzV3ByDHZ1UQh29gCKKwDlFUJCweK-rr7-QZEKnn4hrkFujs6uwTwMrGmJOcWpvFCam0HZzTXE2UM3tSA_PrW4IDE5NS-1JD7c38jAyMjA0tjUxNTR0Jg4VQBfJCul</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><source>esp@cenet</source><creator>KRISHNAPPA, Madan ; PATTANAYAK, Santanu ; MUKHERJEE, Sanku ; BANGALORE, Sanath Sreekanta ; AGARWAL, Pankhuri ; WARDHAN, Uttkarsh ; GHORPADE, Vishal</creator><creatorcontrib>KRISHNAPPA, Madan ; PATTANAYAK, Santanu ; MUKHERJEE, Sanku ; BANGALORE, Sanath Sreekanta ; AGARWAL, Pankhuri ; WARDHAN, Uttkarsh ; GHORPADE, Vishal</creatorcontrib><description>A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function.
Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; INFORMATION STORAGE ; PHYSICS ; STATIC STORES</subject><creationdate>2022</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20220505&DB=EPODOC&CC=WO&NR=2022093545A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25543,76294</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20220505&DB=EPODOC&CC=WO&NR=2022093545A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>KRISHNAPPA, Madan</creatorcontrib><creatorcontrib>PATTANAYAK, Santanu</creatorcontrib><creatorcontrib>MUKHERJEE, Sanku</creatorcontrib><creatorcontrib>BANGALORE, Sanath Sreekanta</creatorcontrib><creatorcontrib>AGARWAL, Pankhuri</creatorcontrib><creatorcontrib>WARDHAN, Uttkarsh</creatorcontrib><creatorcontrib>GHORPADE, Vishal</creatorcontrib><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><description>A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function.
Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.</description><subject>CALCULATING</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>INFORMATION STORAGE</subject><subject>PHYSICS</subject><subject>STATIC STORES</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2022</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZHAIcvX0c_MPcnb1dfULUfBxdQzy8_RzV3ByDHZ1UQh29gCKKwDlFUJCweK-rr7-QZEKnn4hrkFujs6uwTwMrGmJOcWpvFCam0HZzTXE2UM3tSA_PrW4IDE5NS-1JD7c38jAyMjA0tjUxNTR0Jg4VQBfJCul</recordid><startdate>20220505</startdate><enddate>20220505</enddate><creator>KRISHNAPPA, Madan</creator><creator>PATTANAYAK, Santanu</creator><creator>MUKHERJEE, Sanku</creator><creator>BANGALORE, Sanath Sreekanta</creator><creator>AGARWAL, Pankhuri</creator><creator>WARDHAN, Uttkarsh</creator><creator>GHORPADE, Vishal</creator><scope>EVB</scope></search><sort><creationdate>20220505</creationdate><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><author>KRISHNAPPA, Madan ; PATTANAYAK, Santanu ; MUKHERJEE, Sanku ; BANGALORE, Sanath Sreekanta ; AGARWAL, Pankhuri ; WARDHAN, Uttkarsh ; GHORPADE, Vishal</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2022093545A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2022</creationdate><topic>CALCULATING</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>INFORMATION STORAGE</topic><topic>PHYSICS</topic><topic>STATIC STORES</topic><toplevel>online_resources</toplevel><creatorcontrib>KRISHNAPPA, Madan</creatorcontrib><creatorcontrib>PATTANAYAK, Santanu</creatorcontrib><creatorcontrib>MUKHERJEE, Sanku</creatorcontrib><creatorcontrib>BANGALORE, Sanath Sreekanta</creatorcontrib><creatorcontrib>AGARWAL, Pankhuri</creatorcontrib><creatorcontrib>WARDHAN, Uttkarsh</creatorcontrib><creatorcontrib>GHORPADE, Vishal</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>KRISHNAPPA, Madan</au><au>PATTANAYAK, Santanu</au><au>MUKHERJEE, Sanku</au><au>BANGALORE, Sanath Sreekanta</au><au>AGARWAL, Pankhuri</au><au>WARDHAN, Uttkarsh</au><au>GHORPADE, Vishal</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES</title><date>2022-05-05</date><risdate>2022</risdate><abstract>A method performed by a machine learning system includes generating a set of reward values based on a set of parameter values selected by a machine learning system, each reward value of the set of reward values corresponding to a parameter value of the set of parameter values programmed at a device. The method also includes determining a reward function for maximizing a reward corresponding to a set of parameters of the device based on the set of reward values. The method further includes tuning a parameter of the set of parameters based on the reward function.
Un procédé mis en œuvre par un système d'apprentissage automatique consiste à générer un ensemble de valeurs de récompense sur la base d'un ensemble de valeurs de paramètre sélectionnées par un système d'apprentissage automatique, chaque valeur de récompense de l'ensemble de valeurs de récompense correspondant à une valeur de paramètre de l'ensemble de valeurs de paramètre programmées au niveau d'un dispositif. Le procédé consiste également à déterminer une fonction de récompense pour maximiser une récompense correspondant à un ensemble de paramètres du dispositif sur la base de l'ensemble de valeurs de récompense. Le procédé consiste en outre à accorder un paramètre de l'ensemble de paramètres sur la base de la fonction de récompense.</abstract><oa>free_for_read</oa></addata></record> |
fulltext | fulltext_linktorsrc |
identifier | |
ispartof | |
issn | |
language | eng ; fre |
recordid | cdi_epo_espacenet_WO2022093545A1 |
source | esp@cenet |
subjects | CALCULATING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING INFORMATION STORAGE PHYSICS STATIC STORES |
title | REINFORCEMENT LEARNING BASED SCHEME FOR TUNING MEMORY INTERFACES |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-23T08%3A19%3A48IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=KRISHNAPPA,%20Madan&rft.date=2022-05-05&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2022093545A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true |