NEURAL NETWORK VOICE ACTIVITY DETECTION EMPLOYING RUNNING RANGE NORMALIZATION

"실행 중 범위 정규화" 방법은 음성 활동 검출(VAD)에 유용한 특징 값들 범위의 실행 중 추정들을 계산하고 특징들을 원하는 범위에 매핑함으로써 정규화하는 단계를 포함한다. 실행 중 범위 정규화는 VAD 특징들의 최소 및 최대 값들의 실행 중 추정들의 계산, 및 원래의 범위를 원하는 범위에 매핑함으로써 특징 값들을 정규화하는 것을 포함한다. 평활화 계수들은 최소 및 최대 값들의 실행 중 추정들 중 적어도 하나의 변화율을 방향적으로 편향시키도록 선택적으로 선택된다. 정규화된 VAD 특징 파라미터들은 음성 활동을 검...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: VICKERS EARL
Format: Patent
Sprache:eng ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:"실행 중 범위 정규화" 방법은 음성 활동 검출(VAD)에 유용한 특징 값들 범위의 실행 중 추정들을 계산하고 특징들을 원하는 범위에 매핑함으로써 정규화하는 단계를 포함한다. 실행 중 범위 정규화는 VAD 특징들의 최소 및 최대 값들의 실행 중 추정들의 계산, 및 원래의 범위를 원하는 범위에 매핑함으로써 특징 값들을 정규화하는 것을 포함한다. 평활화 계수들은 최소 및 최대 값들의 실행 중 추정들 중 적어도 하나의 변화율을 방향적으로 편향시키도록 선택적으로 선택된다. 정규화된 VAD 특징 파라미터들은 음성 활동을 검출하고, 트레이닝되는 기계 학습 알고리즘을 사용하여 오디오 데이터의 스피치 구성 요소를 분리하거나 향상시키기 위해 기계 학습 알고리즘을 트레이닝하는 데 사용된다. A "running range normalization" method includes computing running estimates of the range of values of features useful for voice activity detection (VAD) and normalizing the features by mapping them to a desired range. Running range normalization includes computation of running estimates of the minimum and maximum values of VAD features and normalizing the feature values by mapping the original range to a desired range. Smoothing coefficients are optionally selected to directionally bias a rate of change of at least one of the running estimates of the minimum and maximum values. The normalized VAD feature parameters are used to train a machine learning algorithm to detect voice activity and to use the trained machine learning algorithm to isolate or enhance the speech component of the audio data.