PRÉ-PROCESSAMENTO AUTOMÁTICO PARA TRADUÇÃO DE CAIXA PRETA

PRÉ-PROCESSAMENTO AUTOMÁTICO PARA TRADUÇÃO DE CAIXA PRETA. Várias modalidades estabelecem sistemas e técnicas para treinar um modelo de pré-processamento de sentença. As técnicas incluem determinar, usando um sistema de tradução automática, uma tradução reversa associada a uma tradução de verdade de...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: VICTORIA BONACI, RITWIK KAILASH KUMAR, VINITH MISRA, AVNEESH SINGH SALUJA, SNEHA MEHTA, BORIS ANTHONY CHEN, BALLAV BIHANI, MARIANNA SEMENIAKIN
Format: Patent
Sprache:por
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:PRÉ-PROCESSAMENTO AUTOMÁTICO PARA TRADUÇÃO DE CAIXA PRETA. Várias modalidades estabelecem sistemas e técnicas para treinar um modelo de pré-processamento de sentença. As técnicas incluem determinar, usando um sistema de tradução automática, uma tradução reversa associada a uma tradução de verdade de uma sentença de origem em um idioma de origem para um idioma de destino, em que a tradução reversa compreende uma tradução da tradução de verdade a partir de um ou mais idiomas de destino para o idioma de origem; determinar, usando o modelo de pré-processamento de sentença, uma sentença simplificada associada à sentença de origem; e atualizar um ou mais parâmetros do modelo de pré-processamento de sentença com base na sentença simplificada e na tradução reversa. Various embodiments set forth systems and techniques for training a sentence preprocessing model. The techniques include determining, using a machine translation system, a back translation associated with a ground truth translation of a source sentence in a source language to a target language, wherein the back translation comprises a translation of the ground truth translation from one or more target languages to the source language; determining, using the sentence preprocessing model, a simplified sentence associated with the source sentence; and updating one or more parameters of the sentence preprocessing model based on the simplified sentence and the back translation.