VOICE INPUT DEVICE AND IMAGE DISPLAY DEVICE EQUIPPED WITH VOICE INPUT DEVICE

Provided is a voice input device that is capable of reducing false recognition of the voice of a user from whom the voice is to be obtained in a situation where a voice source not intended by a recording person is present, for example, when a speaking person is present in the same direction as the u...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: TAMARU, TAKAYUKI, TOKUI, KEI, ARITA, SHINICHI
Format: Patent
Sprache:eng ; fre ; jpn
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Provided is a voice input device that is capable of reducing false recognition of the voice of a user from whom the voice is to be obtained in a situation where a voice source not intended by a recording person is present, for example, when a speaking person is present in the same direction as the user and at a different distance. In the case of this voice input device, a camera and a microphone array are arranged such that a camera reference point (41) and a microphone array reference point (22) are separated from each other by a predetermined distance (L), and a camera-user angle ( ) and a camera-user distance (D) with reference to the camera are calculated on the basis of an image input from the camera. Then, the voice input device calculates a microphone array-user angle (α) with reference to the microphone array based on the camera-user angle ( ) and the camera-user distance (D) and controls the directional angle of the microphone array so as to match the microphone array-user angle (α). La présente invention concerne un dispositif d'entrée vocale qui est capable de réduire les erreurs de reconnaissance de la voix d'un utilisateur dont la voix doit être obtenue dans une situation dans laquelle est présente une source vocale non prévue par une personne effectuant un enregistrement ; par exemple, lorsqu'une personne parlant est présente dans la même direction que l'utilisateur et à une distance différente. Dans le cas du dispositif d'entrée vocale, une caméra et un réseau de microphones sont disposés de sorte qu'un point de référence (41) de la caméra et un point de référence (22) du réseau de microphones (22) soient séparés l'un de l'autre d'une distance prédéterminée (L), et un angle caméra-utilisateur ( ) et une distance caméra-utilisateur (D) en référence à la caméra sont calculés sur la base d'une image entrée depuis la caméra. Ensuite, le dispositif d'entrée vocale calcule un angle du réseau de microphones-utilisateur (α) en référence au réseau de microphones sur la base de l'angle caméra-utilisateur ( ) et de la distance caméra-utilisateur (D) et commande l'angle de direction du réseau de microphones afin qu'il corresponde à l'angle réseau de microphones-utilisateur (α).