APPARATUS AND METHOD FOR DETECTING SILENT SPEECH

An apparatus and method for detecting silent speech. The method includes: measuring (402) three-dimensional acceleration data from vibrations caused by speech organs of the user during subvocalization using an accelerometer configured to be externally attachable to an anterior part of a neck below a...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Taipale, Pauli
Format: Patent
Sprache:eng ; fin ; swe
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:An apparatus and method for detecting silent speech. The method includes: measuring (402) three-dimensional acceleration data from vibrations caused by speech organs of the user during subvocalization using an accelerometer configured to be externally attachable to an anterior part of a neck below a mandible of a user; obtaining (404) repeatedly into a first-in first-out buffer from the accelerometer an acceleration data frame; combining (406) the acceleration data frames from the first-in first-out buffer into an input data structure; classifying (408) each input data structure into a class selected among a set of classes using a trained artificial neural network, each class expressing a specific word or background noise; setting (410) a final class to represent a predetermined number of consecutive classes of the input data structures; and performing (412) an action based on the final class. Laite ja menetelmä hiljaisen puheen detektointiin. Menetelmä sisältää: mitataan (402) kolmiulotteista kiihtyvyysdataa käyttäjän puhe-elinten aiheuttamista vibraatioista subvokalisaation aikana käyttäen kiihtyvyysanturia, joka on konfiguroitu olemaan ulkoisesti kiinnitettävissä käyttäjän kaulan etuosaan leuan alapuolelle; saadaan (404) toistuvasti first-in first-out -puskuriin kiihtyvyysanturilta kiihtyvyysdatakehys; yhdistetään (406) kiihtyvyysdatakehykset first-in first-out -puskurista inputdatarakenteeseen; luokitellaan (408) kukin inputdatarakenne luokkaan, joka on valittu luokkasetin joukosta käyttäen opetettua keinotekoista neuroverkkoa, kukin luokka ilmaisten spesifistä sanaa tai taustamelua; asetetaan (410) lopullinen luokka edustamaan ennaltamäärättyä lukumäärää inputdatarakenteiden peräkkäisiä luokkia; ja suoritetaan (412) toiminta perustuen lopulliseen luokkaan.