Sistema e método para busca fonética de dados
Sistema e método para busca fonética de dados. Um método de buscar foneticamente informações de mídia compreende receber uma pluralidade de consultas de busca de um ou mais sistemas de cliente e fornecer uma representação fonética de cada consulta de busca. Um ou mais trabalhos de busca são instanci...
Gespeichert in:
Hauptverfasser: | , |
---|---|
Format: | Patent |
Sprache: | por |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Sistema e método para busca fonética de dados. Um método de buscar foneticamente informações de mídia compreende receber uma pluralidade de consultas de busca de um ou mais sistemas de cliente e fornecer uma representação fonética de cada consulta de busca. Um ou mais trabalhos de busca são instanciados, cada trabalho de busca compreendendo uma pluralidade de tarefas, cada tarefa sendo organizada para sequencialmente ler um bloco de uma pasta de arquivo. A pasta de arquivo é armazenada em um sistema de arquivamento distribuído (dfs) no qual blocos sequenciais de dados compreendendo a pasta de arquivo são replicados para serem localmente disponíveis para um ou mais processadores de um cluster de processadores para executar as tarefas. Cada bloco armazena arquivos de índice correspondendo a uma pluralidade dos arquivos de mídia de fonte, cada arquivo de índice contendo um fluxo fonético correspondendo a informações de áudio para um dado arquivo de mídia de fonte. Cada tarefa contém representações fonéticas de consultas de busca pendentes para um bloco e sequencialmente busca o bloco para cada consulta de busca pendente. Responsivo ao casamento de uma consulta de busca com um local no fluxo fonético para um arquivo de índice, a localização e um identificador da midia de fonte são retornados para responder à consulta de busca.
A method of phonetically searching media information comprises receiving a plurality of search queries from one or more client systems and providing a phonetic representation of each search query. One or more search jobs are instantiated, each search job comprising a plurality of tasks, each task being arranged to sequentially read a block from an archive file. The archive file is stored within a distributed filing system (DFS) in which sequential blocks of data comprising the archive file are replicated to be locally available to one or more processors from a cluster of processors for executing the tasks. Each block stores index files corresponding to a plurality of the source media files, each index file containing a phonetic stream corresponding to audio information for a given source media file. Each task obtains phonetic representations of outstanding search queries for a block and sequentially searches the block for each outstanding search query. Responsive to matching a search query with a location within the phonetic stream for an index file, the location and an identifier of the source media are returned for responding to the se |
---|