SYSTEMS AND METHODS FOR A TWO PASS DIARIZATION, AUTOMATIC SPEECH RECOGNITION, AND TRANSCRIPT GENERATION

In one embodiment, a method for transcript generation includes receiving an audio file and dividing it into a plurality of chunks. The method further includes sending each instance of the plurality of chunks to a speech service module. The method further includes converting speech to text for each i...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ROBICHAUD, JEAN-PHILIPPE, SKURIKHIN, ALEXEI, JETTE, MIGUEL, STANISLAVOVICH, PETROV EVGENY
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator ROBICHAUD, JEAN-PHILIPPE
SKURIKHIN, ALEXEI
JETTE, MIGUEL
STANISLAVOVICH, PETROV EVGENY
description In one embodiment, a method for transcript generation includes receiving an audio file and dividing it into a plurality of chunks. The method further includes sending each instance of the plurality of chunks to a speech service module. The method further includes converting speech to text for each instance of the plurality of chunks and returning the text for each instance of the plurality of chunks. The method further includes merging the text for each instance of the plurality of chunks to yield an audio file transcript and sending the audio file and chunks to a diarization module. The method further includes performing first pass diarization on the chunks to yield a plurality of diarized chunks and performing second pass diarization on the plurality of diarized chunks and the audio file to yield a diarized audio file. The method further includes merging the files to yield a final transcript. Selon un mode de réalisation, la présente invention concerne un procédé de génération de transcription comprenant la réception d'un fichier audio et la division dudit fichier en une pluralité de segments. Le procédé consiste en outre à envoyer chaque instance de la pluralité de segments à un module de service vocal. Le procédé comprend en outre la conversion de la parole en texte pour chaque instance de la pluralité de fragments et le renvoi du texte pour chaque instance de la pluralité de segments. Le procédé comprend en outre la fusion du texte pour chaque instance de la pluralité de segments afin d'obtenir une transcription du fichier audio et l'envoi du fichier audio et des segments à un module de segmentation et regroupement. Le procédé comprend en outre la réalisation d'une opération de segmentation et regroupement de premier passage sur les segments pour obtenir une pluralité de segments segmentés et regroupés et la réalisation d'une seconde opération de segmentation et regroupement de second passage sur la pluralité de segments segmentés et regroupés et le fichier audio pour obtenir un fichier audio segmenté et regroupé. Le procédé comprend en outre la fusion des fichiers pour obtenir une transcription finale.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_CA3115548A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>CA3115548A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_CA3115548A13</originalsourceid><addsrcrecordid>eNqNjDEKwkAQRdNYiHqHOYAWIQZsh91JssXuhpkRiU0IstqIBuL9MUgOYPU_vP_-OntIJ0peAIMFT9pEK1BFBgS9RGhRBKxDdldUF8Me8KzRz92AtESmASYT6-AWOr8oYxDDrlWoKRD_xG22ug_PKe2W3GRQkZrmkMZ3n6ZxuKVX-vQGizwvy-MJ8-KPyReD4DTh</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>SYSTEMS AND METHODS FOR A TWO PASS DIARIZATION, AUTOMATIC SPEECH RECOGNITION, AND TRANSCRIPT GENERATION</title><source>esp@cenet</source><creator>ROBICHAUD, JEAN-PHILIPPE ; SKURIKHIN, ALEXEI ; JETTE, MIGUEL ; STANISLAVOVICH, PETROV EVGENY</creator><creatorcontrib>ROBICHAUD, JEAN-PHILIPPE ; SKURIKHIN, ALEXEI ; JETTE, MIGUEL ; STANISLAVOVICH, PETROV EVGENY</creatorcontrib><description>In one embodiment, a method for transcript generation includes receiving an audio file and dividing it into a plurality of chunks. The method further includes sending each instance of the plurality of chunks to a speech service module. The method further includes converting speech to text for each instance of the plurality of chunks and returning the text for each instance of the plurality of chunks. The method further includes merging the text for each instance of the plurality of chunks to yield an audio file transcript and sending the audio file and chunks to a diarization module. The method further includes performing first pass diarization on the chunks to yield a plurality of diarized chunks and performing second pass diarization on the plurality of diarized chunks and the audio file to yield a diarized audio file. The method further includes merging the files to yield a final transcript. Selon un mode de réalisation, la présente invention concerne un procédé de génération de transcription comprenant la réception d'un fichier audio et la division dudit fichier en une pluralité de segments. Le procédé consiste en outre à envoyer chaque instance de la pluralité de segments à un module de service vocal. Le procédé comprend en outre la conversion de la parole en texte pour chaque instance de la pluralité de fragments et le renvoi du texte pour chaque instance de la pluralité de segments. Le procédé comprend en outre la fusion du texte pour chaque instance de la pluralité de segments afin d'obtenir une transcription du fichier audio et l'envoi du fichier audio et des segments à un module de segmentation et regroupement. Le procédé comprend en outre la réalisation d'une opération de segmentation et regroupement de premier passage sur les segments pour obtenir une pluralité de segments segmentés et regroupés et la réalisation d'une seconde opération de segmentation et regroupement de second passage sur la pluralité de segments segmentés et regroupés et le fichier audio pour obtenir un fichier audio segmenté et regroupé. Le procédé comprend en outre la fusion des fichiers pour obtenir une transcription finale.</description><language>eng ; fre</language><subject>ACOUSTICS ; MEASURING ; MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER,MECHANICAL EFFICIENCY, OR FLUID PRESSURE ; MUSICAL INSTRUMENTS ; PHYSICS ; SPEECH ANALYSIS OR SYNTHESIS ; SPEECH OR AUDIO CODING OR DECODING ; SPEECH OR VOICE PROCESSING ; SPEECH RECOGNITION ; TESTING</subject><creationdate>2020</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20200507&amp;DB=EPODOC&amp;CC=CA&amp;NR=3115548A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,776,881,25542,76290</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20200507&amp;DB=EPODOC&amp;CC=CA&amp;NR=3115548A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>ROBICHAUD, JEAN-PHILIPPE</creatorcontrib><creatorcontrib>SKURIKHIN, ALEXEI</creatorcontrib><creatorcontrib>JETTE, MIGUEL</creatorcontrib><creatorcontrib>STANISLAVOVICH, PETROV EVGENY</creatorcontrib><title>SYSTEMS AND METHODS FOR A TWO PASS DIARIZATION, AUTOMATIC SPEECH RECOGNITION, AND TRANSCRIPT GENERATION</title><description>In one embodiment, a method for transcript generation includes receiving an audio file and dividing it into a plurality of chunks. The method further includes sending each instance of the plurality of chunks to a speech service module. The method further includes converting speech to text for each instance of the plurality of chunks and returning the text for each instance of the plurality of chunks. The method further includes merging the text for each instance of the plurality of chunks to yield an audio file transcript and sending the audio file and chunks to a diarization module. The method further includes performing first pass diarization on the chunks to yield a plurality of diarized chunks and performing second pass diarization on the plurality of diarized chunks and the audio file to yield a diarized audio file. The method further includes merging the files to yield a final transcript. Selon un mode de réalisation, la présente invention concerne un procédé de génération de transcription comprenant la réception d'un fichier audio et la division dudit fichier en une pluralité de segments. Le procédé consiste en outre à envoyer chaque instance de la pluralité de segments à un module de service vocal. Le procédé comprend en outre la conversion de la parole en texte pour chaque instance de la pluralité de fragments et le renvoi du texte pour chaque instance de la pluralité de segments. Le procédé comprend en outre la fusion du texte pour chaque instance de la pluralité de segments afin d'obtenir une transcription du fichier audio et l'envoi du fichier audio et des segments à un module de segmentation et regroupement. Le procédé comprend en outre la réalisation d'une opération de segmentation et regroupement de premier passage sur les segments pour obtenir une pluralité de segments segmentés et regroupés et la réalisation d'une seconde opération de segmentation et regroupement de second passage sur la pluralité de segments segmentés et regroupés et le fichier audio pour obtenir un fichier audio segmenté et regroupé. Le procédé comprend en outre la fusion des fichiers pour obtenir une transcription finale.</description><subject>ACOUSTICS</subject><subject>MEASURING</subject><subject>MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER,MECHANICAL EFFICIENCY, OR FLUID PRESSURE</subject><subject>MUSICAL INSTRUMENTS</subject><subject>PHYSICS</subject><subject>SPEECH ANALYSIS OR SYNTHESIS</subject><subject>SPEECH OR AUDIO CODING OR DECODING</subject><subject>SPEECH OR VOICE PROCESSING</subject><subject>SPEECH RECOGNITION</subject><subject>TESTING</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2020</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNqNjDEKwkAQRdNYiHqHOYAWIQZsh91JssXuhpkRiU0IstqIBuL9MUgOYPU_vP_-OntIJ0peAIMFT9pEK1BFBgS9RGhRBKxDdldUF8Me8KzRz92AtESmASYT6-AWOr8oYxDDrlWoKRD_xG22ug_PKe2W3GRQkZrmkMZ3n6ZxuKVX-vQGizwvy-MJ8-KPyReD4DTh</recordid><startdate>20200507</startdate><enddate>20200507</enddate><creator>ROBICHAUD, JEAN-PHILIPPE</creator><creator>SKURIKHIN, ALEXEI</creator><creator>JETTE, MIGUEL</creator><creator>STANISLAVOVICH, PETROV EVGENY</creator><scope>EVB</scope></search><sort><creationdate>20200507</creationdate><title>SYSTEMS AND METHODS FOR A TWO PASS DIARIZATION, AUTOMATIC SPEECH RECOGNITION, AND TRANSCRIPT GENERATION</title><author>ROBICHAUD, JEAN-PHILIPPE ; SKURIKHIN, ALEXEI ; JETTE, MIGUEL ; STANISLAVOVICH, PETROV EVGENY</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_CA3115548A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2020</creationdate><topic>ACOUSTICS</topic><topic>MEASURING</topic><topic>MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER,MECHANICAL EFFICIENCY, OR FLUID PRESSURE</topic><topic>MUSICAL INSTRUMENTS</topic><topic>PHYSICS</topic><topic>SPEECH ANALYSIS OR SYNTHESIS</topic><topic>SPEECH OR AUDIO CODING OR DECODING</topic><topic>SPEECH OR VOICE PROCESSING</topic><topic>SPEECH RECOGNITION</topic><topic>TESTING</topic><toplevel>online_resources</toplevel><creatorcontrib>ROBICHAUD, JEAN-PHILIPPE</creatorcontrib><creatorcontrib>SKURIKHIN, ALEXEI</creatorcontrib><creatorcontrib>JETTE, MIGUEL</creatorcontrib><creatorcontrib>STANISLAVOVICH, PETROV EVGENY</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>ROBICHAUD, JEAN-PHILIPPE</au><au>SKURIKHIN, ALEXEI</au><au>JETTE, MIGUEL</au><au>STANISLAVOVICH, PETROV EVGENY</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>SYSTEMS AND METHODS FOR A TWO PASS DIARIZATION, AUTOMATIC SPEECH RECOGNITION, AND TRANSCRIPT GENERATION</title><date>2020-05-07</date><risdate>2020</risdate><abstract>In one embodiment, a method for transcript generation includes receiving an audio file and dividing it into a plurality of chunks. The method further includes sending each instance of the plurality of chunks to a speech service module. The method further includes converting speech to text for each instance of the plurality of chunks and returning the text for each instance of the plurality of chunks. The method further includes merging the text for each instance of the plurality of chunks to yield an audio file transcript and sending the audio file and chunks to a diarization module. The method further includes performing first pass diarization on the chunks to yield a plurality of diarized chunks and performing second pass diarization on the plurality of diarized chunks and the audio file to yield a diarized audio file. The method further includes merging the files to yield a final transcript. Selon un mode de réalisation, la présente invention concerne un procédé de génération de transcription comprenant la réception d'un fichier audio et la division dudit fichier en une pluralité de segments. Le procédé consiste en outre à envoyer chaque instance de la pluralité de segments à un module de service vocal. Le procédé comprend en outre la conversion de la parole en texte pour chaque instance de la pluralité de fragments et le renvoi du texte pour chaque instance de la pluralité de segments. Le procédé comprend en outre la fusion du texte pour chaque instance de la pluralité de segments afin d'obtenir une transcription du fichier audio et l'envoi du fichier audio et des segments à un module de segmentation et regroupement. Le procédé comprend en outre la réalisation d'une opération de segmentation et regroupement de premier passage sur les segments pour obtenir une pluralité de segments segmentés et regroupés et la réalisation d'une seconde opération de segmentation et regroupement de second passage sur la pluralité de segments segmentés et regroupés et le fichier audio pour obtenir un fichier audio segmenté et regroupé. Le procédé comprend en outre la fusion des fichiers pour obtenir une transcription finale.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_CA3115548A1
source esp@cenet
subjects ACOUSTICS
MEASURING
MEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER,MECHANICAL EFFICIENCY, OR FLUID PRESSURE
MUSICAL INSTRUMENTS
PHYSICS
SPEECH ANALYSIS OR SYNTHESIS
SPEECH OR AUDIO CODING OR DECODING
SPEECH OR VOICE PROCESSING
SPEECH RECOGNITION
TESTING
title SYSTEMS AND METHODS FOR A TWO PASS DIARIZATION, AUTOMATIC SPEECH RECOGNITION, AND TRANSCRIPT GENERATION
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-02T14%3A25%3A38IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=ROBICHAUD,%20JEAN-PHILIPPE&rft.date=2020-05-07&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3ECA3115548A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true