VOICE ACTIVITY DETECTOR AND METHODS THEREFOR

Methods, systems, and apparatuses for a low-complexity acoustic activity detector are disclosed. A method includes forming a sequence of frames by blocking digital data representative of acoustic activity. For each frame, the method includes determining a plurality of power metrics based on a transf...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: YE, Anne, PATURI, Rohit, NEMALA, Sridhar Krishna, RUB, Leonardo, LAROCHE, Jean
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator YE, Anne
PATURI, Rohit
NEMALA, Sridhar Krishna
RUB, Leonardo
LAROCHE, Jean
description Methods, systems, and apparatuses for a low-complexity acoustic activity detector are disclosed. A method includes forming a sequence of frames by blocking digital data representative of acoustic activity. For each frame, the method includes determining a plurality of power metrics based on a transformation of the frame data from the time-domain to the frequency domain using a discrete Fourier transform having constant coefficients dependent on a plurality of select frequencies within a range of voice frequencies. For each frame, the method also includes determining a plurality of signal to noise ratios for each power metric to a corresponding noise metric. The method also includes, for each frame, determining one or more signal to noise ratios. The method includes determining whether the digital data representative of the acoustic activity includes voice activity by determining whether the signal to noise ratios for each of a plurality of frames satisfies a criterion. L'invention concerne des procédés, des systèmes et des appareils destinés à un détecteur d'activité acoustique de faible complexité. Un procédé comprend une première étape consistant à former une séquence de trames en bloquant des données numériques représentatives d'une activité acoustique. Puis, pour chaque trame, le procédé comprend les étapes consistant à : déterminer une pluralité de mesures de puissance sur la base d'une conversion des données des trames du domaine temporel au domaine fréquentiel à l'aide d'une transformée de Fourier discrète ayant des coefficients constants en fonction d'une pluralité de fréquences sélectionnées dans une plage de fréquences vocales ; déterminer une pluralité de rapports signal sur bruit de chaque mesure de puissance à une mesure de bruit correspondante ; déterminer un ou plusieurs rapports signal sur bruit ; et déterminer si les données numériques représentatives de l'activité acoustique contiennent une activité vocale en déterminant si le rapport signal sur bruit pour chaque trame d'une pluralité de trames répond à un critère.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2018152034A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2018152034A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2018152034A13</originalsourceid><addsrcrecordid>eNrjZNAJ8_d0dlVwdA7xDPMMiVRwcQ1xdQ7xD1Jw9HNR8HUN8fB3CVYI8XANcnXzD-JhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGhhaGpkYGxiaOhsbEqQIAMG8mGg</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>VOICE ACTIVITY DETECTOR AND METHODS THEREFOR</title><source>esp@cenet</source><creator>YE, Anne ; PATURI, Rohit ; NEMALA, Sridhar Krishna ; RUB, Leonardo ; LAROCHE, Jean</creator><creatorcontrib>YE, Anne ; PATURI, Rohit ; NEMALA, Sridhar Krishna ; RUB, Leonardo ; LAROCHE, Jean</creatorcontrib><description>Methods, systems, and apparatuses for a low-complexity acoustic activity detector are disclosed. A method includes forming a sequence of frames by blocking digital data representative of acoustic activity. For each frame, the method includes determining a plurality of power metrics based on a transformation of the frame data from the time-domain to the frequency domain using a discrete Fourier transform having constant coefficients dependent on a plurality of select frequencies within a range of voice frequencies. For each frame, the method also includes determining a plurality of signal to noise ratios for each power metric to a corresponding noise metric. The method also includes, for each frame, determining one or more signal to noise ratios. The method includes determining whether the digital data representative of the acoustic activity includes voice activity by determining whether the signal to noise ratios for each of a plurality of frames satisfies a criterion. L'invention concerne des procédés, des systèmes et des appareils destinés à un détecteur d'activité acoustique de faible complexité. Un procédé comprend une première étape consistant à former une séquence de trames en bloquant des données numériques représentatives d'une activité acoustique. Puis, pour chaque trame, le procédé comprend les étapes consistant à : déterminer une pluralité de mesures de puissance sur la base d'une conversion des données des trames du domaine temporel au domaine fréquentiel à l'aide d'une transformée de Fourier discrète ayant des coefficients constants en fonction d'une pluralité de fréquences sélectionnées dans une plage de fréquences vocales ; déterminer une pluralité de rapports signal sur bruit de chaque mesure de puissance à une mesure de bruit correspondante ; déterminer un ou plusieurs rapports signal sur bruit ; et déterminer si les données numériques représentatives de l'activité acoustique contiennent une activité vocale en déterminant si le rapport signal sur bruit pour chaque trame d'une pluralité de trames répond à un critère.</description><language>eng ; fre</language><subject>ACOUSTICS ; CALCULATING ; COMPUTING ; COUNTING ; DEAF-AID SETS ; ELECTRIC COMMUNICATION TECHNIQUE ; ELECTRIC DIGITAL DATA PROCESSING ; ELECTRICITY ; LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKEACOUSTIC ELECTROMECHANICAL TRANSDUCERS ; MUSICAL INSTRUMENTS ; PHYSICS ; PUBLIC ADDRESS SYSTEMS ; SPEECH ANALYSIS OR SYNTHESIS ; SPEECH OR AUDIO CODING OR DECODING ; SPEECH OR VOICE PROCESSING ; SPEECH RECOGNITION</subject><creationdate>2018</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20180823&amp;DB=EPODOC&amp;CC=WO&amp;NR=2018152034A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25542,76289</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20180823&amp;DB=EPODOC&amp;CC=WO&amp;NR=2018152034A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>YE, Anne</creatorcontrib><creatorcontrib>PATURI, Rohit</creatorcontrib><creatorcontrib>NEMALA, Sridhar Krishna</creatorcontrib><creatorcontrib>RUB, Leonardo</creatorcontrib><creatorcontrib>LAROCHE, Jean</creatorcontrib><title>VOICE ACTIVITY DETECTOR AND METHODS THEREFOR</title><description>Methods, systems, and apparatuses for a low-complexity acoustic activity detector are disclosed. A method includes forming a sequence of frames by blocking digital data representative of acoustic activity. For each frame, the method includes determining a plurality of power metrics based on a transformation of the frame data from the time-domain to the frequency domain using a discrete Fourier transform having constant coefficients dependent on a plurality of select frequencies within a range of voice frequencies. For each frame, the method also includes determining a plurality of signal to noise ratios for each power metric to a corresponding noise metric. The method also includes, for each frame, determining one or more signal to noise ratios. The method includes determining whether the digital data representative of the acoustic activity includes voice activity by determining whether the signal to noise ratios for each of a plurality of frames satisfies a criterion. L'invention concerne des procédés, des systèmes et des appareils destinés à un détecteur d'activité acoustique de faible complexité. Un procédé comprend une première étape consistant à former une séquence de trames en bloquant des données numériques représentatives d'une activité acoustique. Puis, pour chaque trame, le procédé comprend les étapes consistant à : déterminer une pluralité de mesures de puissance sur la base d'une conversion des données des trames du domaine temporel au domaine fréquentiel à l'aide d'une transformée de Fourier discrète ayant des coefficients constants en fonction d'une pluralité de fréquences sélectionnées dans une plage de fréquences vocales ; déterminer une pluralité de rapports signal sur bruit de chaque mesure de puissance à une mesure de bruit correspondante ; déterminer un ou plusieurs rapports signal sur bruit ; et déterminer si les données numériques représentatives de l'activité acoustique contiennent une activité vocale en déterminant si le rapport signal sur bruit pour chaque trame d'une pluralité de trames répond à un critère.</description><subject>ACOUSTICS</subject><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>DEAF-AID SETS</subject><subject>ELECTRIC COMMUNICATION TECHNIQUE</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>ELECTRICITY</subject><subject>LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKEACOUSTIC ELECTROMECHANICAL TRANSDUCERS</subject><subject>MUSICAL INSTRUMENTS</subject><subject>PHYSICS</subject><subject>PUBLIC ADDRESS SYSTEMS</subject><subject>SPEECH ANALYSIS OR SYNTHESIS</subject><subject>SPEECH OR AUDIO CODING OR DECODING</subject><subject>SPEECH OR VOICE PROCESSING</subject><subject>SPEECH RECOGNITION</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2018</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZNAJ8_d0dlVwdA7xDPMMiVRwcQ1xdQ7xD1Jw9HNR8HUN8fB3CVYI8XANcnXzD-JhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGhhaGpkYGxiaOhsbEqQIAMG8mGg</recordid><startdate>20180823</startdate><enddate>20180823</enddate><creator>YE, Anne</creator><creator>PATURI, Rohit</creator><creator>NEMALA, Sridhar Krishna</creator><creator>RUB, Leonardo</creator><creator>LAROCHE, Jean</creator><scope>EVB</scope></search><sort><creationdate>20180823</creationdate><title>VOICE ACTIVITY DETECTOR AND METHODS THEREFOR</title><author>YE, Anne ; PATURI, Rohit ; NEMALA, Sridhar Krishna ; RUB, Leonardo ; LAROCHE, Jean</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2018152034A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2018</creationdate><topic>ACOUSTICS</topic><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>DEAF-AID SETS</topic><topic>ELECTRIC COMMUNICATION TECHNIQUE</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>ELECTRICITY</topic><topic>LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKEACOUSTIC ELECTROMECHANICAL TRANSDUCERS</topic><topic>MUSICAL INSTRUMENTS</topic><topic>PHYSICS</topic><topic>PUBLIC ADDRESS SYSTEMS</topic><topic>SPEECH ANALYSIS OR SYNTHESIS</topic><topic>SPEECH OR AUDIO CODING OR DECODING</topic><topic>SPEECH OR VOICE PROCESSING</topic><topic>SPEECH RECOGNITION</topic><toplevel>online_resources</toplevel><creatorcontrib>YE, Anne</creatorcontrib><creatorcontrib>PATURI, Rohit</creatorcontrib><creatorcontrib>NEMALA, Sridhar Krishna</creatorcontrib><creatorcontrib>RUB, Leonardo</creatorcontrib><creatorcontrib>LAROCHE, Jean</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>YE, Anne</au><au>PATURI, Rohit</au><au>NEMALA, Sridhar Krishna</au><au>RUB, Leonardo</au><au>LAROCHE, Jean</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>VOICE ACTIVITY DETECTOR AND METHODS THEREFOR</title><date>2018-08-23</date><risdate>2018</risdate><abstract>Methods, systems, and apparatuses for a low-complexity acoustic activity detector are disclosed. A method includes forming a sequence of frames by blocking digital data representative of acoustic activity. For each frame, the method includes determining a plurality of power metrics based on a transformation of the frame data from the time-domain to the frequency domain using a discrete Fourier transform having constant coefficients dependent on a plurality of select frequencies within a range of voice frequencies. For each frame, the method also includes determining a plurality of signal to noise ratios for each power metric to a corresponding noise metric. The method also includes, for each frame, determining one or more signal to noise ratios. The method includes determining whether the digital data representative of the acoustic activity includes voice activity by determining whether the signal to noise ratios for each of a plurality of frames satisfies a criterion. L'invention concerne des procédés, des systèmes et des appareils destinés à un détecteur d'activité acoustique de faible complexité. Un procédé comprend une première étape consistant à former une séquence de trames en bloquant des données numériques représentatives d'une activité acoustique. Puis, pour chaque trame, le procédé comprend les étapes consistant à : déterminer une pluralité de mesures de puissance sur la base d'une conversion des données des trames du domaine temporel au domaine fréquentiel à l'aide d'une transformée de Fourier discrète ayant des coefficients constants en fonction d'une pluralité de fréquences sélectionnées dans une plage de fréquences vocales ; déterminer une pluralité de rapports signal sur bruit de chaque mesure de puissance à une mesure de bruit correspondante ; déterminer un ou plusieurs rapports signal sur bruit ; et déterminer si les données numériques représentatives de l'activité acoustique contiennent une activité vocale en déterminant si le rapport signal sur bruit pour chaque trame d'une pluralité de trames répond à un critère.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2018152034A1
source esp@cenet
subjects ACOUSTICS
CALCULATING
COMPUTING
COUNTING
DEAF-AID SETS
ELECTRIC COMMUNICATION TECHNIQUE
ELECTRIC DIGITAL DATA PROCESSING
ELECTRICITY
LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKEACOUSTIC ELECTROMECHANICAL TRANSDUCERS
MUSICAL INSTRUMENTS
PHYSICS
PUBLIC ADDRESS SYSTEMS
SPEECH ANALYSIS OR SYNTHESIS
SPEECH OR AUDIO CODING OR DECODING
SPEECH OR VOICE PROCESSING
SPEECH RECOGNITION
title VOICE ACTIVITY DETECTOR AND METHODS THEREFOR
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-08T00%3A05%3A45IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=YE,%20Anne&rft.date=2018-08-23&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2018152034A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true