콘텐츠 기반 검색을 위한 오디오 신호의 잠재-공간 표현
피치, 음색, 감쇠, 잔향, 및 다른 음향 심리 속성들에 있어서의 변동을 나타내는 디지털 오디오 신호들로부터의 특징들을 추출하고, 추출된 특징들로부터, 디지털 오디오 신호들의 콘텍스트 관련 잠재-공간 표현들을 생성하기 위한 인공 신경망 모델을 학습하기 위한 방법 및 시스템이 제공된다. 또한, 잠재-공간 표현들은 디지털 오디오 신호들 간의 음향 심리 유사성을 결정할 목적으로 비교가능한 디지털 오디오 신호들의 일관된 잠재-공간 표현들을 생성하기 위한 인공 신경망 모델을 학습하기 위한 방법 및 시스템이 제공된다. 또한, 디지털 오디오 신...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 피치, 음색, 감쇠, 잔향, 및 다른 음향 심리 속성들에 있어서의 변동을 나타내는 디지털 오디오 신호들로부터의 특징들을 추출하고, 추출된 특징들로부터, 디지털 오디오 신호들의 콘텍스트 관련 잠재-공간 표현들을 생성하기 위한 인공 신경망 모델을 학습하기 위한 방법 및 시스템이 제공된다. 또한, 잠재-공간 표현들은 디지털 오디오 신호들 간의 음향 심리 유사성을 결정할 목적으로 비교가능한 디지털 오디오 신호들의 일관된 잠재-공간 표현들을 생성하기 위한 인공 신경망 모델을 학습하기 위한 방법 및 시스템이 제공된다. 또한, 디지털 오디오 신호들로부터의 특징들을 추출하고, 추출된 특징들로부터, 신호들 간의 음향 심리 차이들을 나타내는 신호들의 두드러진 속성들을 선택하는 것을 주의하는 디지털 오디오 신호들의 잠재-공간 표현들을 생성하기 위한 인공 신경망 모델을 학습하기 위한 방법 및 시스템이 제공된다.
A method and system are provided for extracting features from digital audio signals which exhibit variations in pitch, timbre, decay, reverberation, and other psychoacoustic attributes and learning, from the extracted features, an artificial neural network model for generating contextual latent-space representations of digital audio signals. A method and system are also provided for learning an artificial neural network model for generating consistent latent-space representations of digital audio signals in which the generated latent-space representations are comparable for the purposes of determining psychoacoustic similarity between digital audio signals. A method and system are also provided for extracting features from digital audio signals and learning, from the extracted features, an artificial neural network model for generating latent-space representations of digital audio signals which take care of selecting salient attributes of the signals that represent psychoacoustic differences between the signals. |
---|