AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR

There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator may generate an audio signal from an input signal and target data repre-senting the audio signal. The target data is derived from text. The audio generator comprises: a first processing...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: PIA, NICOLA, FUCHS, GUILLAUME, BUTHE, JAN, GUPTA, KISHAN, KORSE, SRIKANTH, AHMED, AHMED MUSTAFA MAHMOUD, MULTRUS, MARKUS
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator PIA, NICOLA
FUCHS, GUILLAUME
BUTHE, JAN
GUPTA, KISHAN
KORSE, SRIKANTH
AHMED, AHMED MUSTAFA MAHMOUD
MULTRUS, MARKUS
description There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator may generate an audio signal from an input signal and target data repre-senting the audio signal. The target data is derived from text. The audio generator comprises: a first processing block, receiving first data derived from the input signal and outputting first output data; a second processing block, receiving, as second data, the first output data or data de-rived from the first output data. The first processing block comprises: a conditioning set of learnable layers configured to process the target data to obtain conditioning features parameters; and a styling element, configured to apply the conditioning feature parameters to the first data or normalized first data. La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_CA3195582A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>CA3195582A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_CA3195582A13</originalsourceid><addsrcrecordid>eNrjZIhyDHXx9Fdwd_VzDXIM8Q9ScPRzUfB1DfHwdwlWcAPyoTKefu5AKQWI6mBPdz9HH7DSkCBHTz8USbhRPAysaYk5xam8UJqbQcHNNcTZQze1ID8-tbggMTk1L7Uk3tnR2NDS1NTCyNHQmAglAKzoMMo</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR</title><source>esp@cenet</source><creator>PIA, NICOLA ; FUCHS, GUILLAUME ; BUTHE, JAN ; GUPTA, KISHAN ; KORSE, SRIKANTH ; AHMED, AHMED MUSTAFA MAHMOUD ; MULTRUS, MARKUS</creator><creatorcontrib>PIA, NICOLA ; FUCHS, GUILLAUME ; BUTHE, JAN ; GUPTA, KISHAN ; KORSE, SRIKANTH ; AHMED, AHMED MUSTAFA MAHMOUD ; MULTRUS, MARKUS</creatorcontrib><description>There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator may generate an audio signal from an input signal and target data repre-senting the audio signal. The target data is derived from text. The audio generator comprises: a first processing block, receiving first data derived from the input signal and outputting first output data; a second processing block, receiving, as second data, the first output data or data de-rived from the first output data. The first processing block comprises: a conditioning set of learnable layers configured to process the target data to obtain conditioning features parameters; and a styling element, configured to apply the conditioning feature parameters to the first data or normalized first data. La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').</description><language>eng ; fre</language><subject>ACOUSTICS ; CALCULATING ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; MUSICAL INSTRUMENTS ; PHYSICS ; SPEECH ANALYSIS OR SYNTHESIS ; SPEECH OR AUDIO CODING OR DECODING ; SPEECH OR VOICE PROCESSING ; SPEECH RECOGNITION</subject><creationdate>2022</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220421&amp;DB=EPODOC&amp;CC=CA&amp;NR=3195582A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25563,76318</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20220421&amp;DB=EPODOC&amp;CC=CA&amp;NR=3195582A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>PIA, NICOLA</creatorcontrib><creatorcontrib>FUCHS, GUILLAUME</creatorcontrib><creatorcontrib>BUTHE, JAN</creatorcontrib><creatorcontrib>GUPTA, KISHAN</creatorcontrib><creatorcontrib>KORSE, SRIKANTH</creatorcontrib><creatorcontrib>AHMED, AHMED MUSTAFA MAHMOUD</creatorcontrib><creatorcontrib>MULTRUS, MARKUS</creatorcontrib><title>AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR</title><description>There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator may generate an audio signal from an input signal and target data repre-senting the audio signal. The target data is derived from text. The audio generator comprises: a first processing block, receiving first data derived from the input signal and outputting first output data; a second processing block, receiving, as second data, the first output data or data de-rived from the first output data. The first processing block comprises: a conditioning set of learnable layers configured to process the target data to obtain conditioning features parameters; and a styling element, configured to apply the conditioning feature parameters to the first data or normalized first data. La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').</description><subject>ACOUSTICS</subject><subject>CALCULATING</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>MUSICAL INSTRUMENTS</subject><subject>PHYSICS</subject><subject>SPEECH ANALYSIS OR SYNTHESIS</subject><subject>SPEECH OR AUDIO CODING OR DECODING</subject><subject>SPEECH OR VOICE PROCESSING</subject><subject>SPEECH RECOGNITION</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2022</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZIhyDHXx9Fdwd_VzDXIM8Q9ScPRzUfB1DfHwdwlWcAPyoTKefu5AKQWI6mBPdz9HH7DSkCBHTz8USbhRPAysaYk5xam8UJqbQcHNNcTZQze1ID8-tbggMTk1L7Uk3tnR2NDS1NTCyNHQmAglAKzoMMo</recordid><startdate>20220421</startdate><enddate>20220421</enddate><creator>PIA, NICOLA</creator><creator>FUCHS, GUILLAUME</creator><creator>BUTHE, JAN</creator><creator>GUPTA, KISHAN</creator><creator>KORSE, SRIKANTH</creator><creator>AHMED, AHMED MUSTAFA MAHMOUD</creator><creator>MULTRUS, MARKUS</creator><scope>EVB</scope></search><sort><creationdate>20220421</creationdate><title>AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR</title><author>PIA, NICOLA ; FUCHS, GUILLAUME ; BUTHE, JAN ; GUPTA, KISHAN ; KORSE, SRIKANTH ; AHMED, AHMED MUSTAFA MAHMOUD ; MULTRUS, MARKUS</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_CA3195582A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2022</creationdate><topic>ACOUSTICS</topic><topic>CALCULATING</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>MUSICAL INSTRUMENTS</topic><topic>PHYSICS</topic><topic>SPEECH ANALYSIS OR SYNTHESIS</topic><topic>SPEECH OR AUDIO CODING OR DECODING</topic><topic>SPEECH OR VOICE PROCESSING</topic><topic>SPEECH RECOGNITION</topic><toplevel>online_resources</toplevel><creatorcontrib>PIA, NICOLA</creatorcontrib><creatorcontrib>FUCHS, GUILLAUME</creatorcontrib><creatorcontrib>BUTHE, JAN</creatorcontrib><creatorcontrib>GUPTA, KISHAN</creatorcontrib><creatorcontrib>KORSE, SRIKANTH</creatorcontrib><creatorcontrib>AHMED, AHMED MUSTAFA MAHMOUD</creatorcontrib><creatorcontrib>MULTRUS, MARKUS</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>PIA, NICOLA</au><au>FUCHS, GUILLAUME</au><au>BUTHE, JAN</au><au>GUPTA, KISHAN</au><au>KORSE, SRIKANTH</au><au>AHMED, AHMED MUSTAFA MAHMOUD</au><au>MULTRUS, MARKUS</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR</title><date>2022-04-21</date><risdate>2022</risdate><abstract>There are disclosed techniques for generating an audio signal and training an audio generator. An audio generator may generate an audio signal from an input signal and target data repre-senting the audio signal. The target data is derived from text. The audio generator comprises: a first processing block, receiving first data derived from the input signal and outputting first output data; a second processing block, receiving, as second data, the first output data or data de-rived from the first output data. The first processing block comprises: a conditioning set of learnable layers configured to process the target data to obtain conditioning features parameters; and a styling element, configured to apply the conditioning feature parameters to the first data or normalized first data. La divulgation concerne des techniques de génération d'un signal audio et d'entraînement d'un générateur audio. Un générateur audio (10) peut générer un signal audio (16) à partir d'un signal d'entrée (14) et des données cibles (12) représentant le signal audio (16). Les données cibles (12) sont dérivées de texte. Le générateur audio comprend : un premier bloc de traitement (40, 50, 50a-50h), recevant de premières données (15, 59a) dérivées du signal d'entrée (14) et délivrant de premières données de sortie (69) ; un second bloc de traitement (45), recevant, en tant que secondes données, les premières données de sortie (69) ou des données dérivées des premières données de sortie (69). Le premier bloc de traitement (50) comprend : un ensemble de conditionnement de couches pouvant être apprises (71, 72, 73) configuré pour traiter les données cibles (12) pour obtenir des paramètres de caractéristiques de conditionnement (74, 75) ; et un élément de mise en forme (77), configuré pour appliquer les paramètres de caractéristiques de conditionnement (74, 75) aux premières données (15, 59a) ou à de premières données normalisées (59, 76').</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_CA3195582A1
source esp@cenet
subjects ACOUSTICS
CALCULATING
COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS
COMPUTING
COUNTING
MUSICAL INSTRUMENTS
PHYSICS
SPEECH ANALYSIS OR SYNTHESIS
SPEECH OR AUDIO CODING OR DECODING
SPEECH OR VOICE PROCESSING
SPEECH RECOGNITION
title AUDIO GENERATOR AND METHODS FOR GENERATING AN AUDIO SIGNAL AND TRAINING AN AUDIO GENERATOR
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-12T05%3A24%3A54IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=PIA,%20NICOLA&rft.date=2022-04-21&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3ECA3195582A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true