CLUSTERING-BASED RECOGNITION OF TEXT IN VIDEOS

Systems and methods for spatial-textual clustering-based recognition of text in videos are disclosed. A method includes performing textual clustering on a first subset of a set of predictions that correspond to numeric characters only and performing spatial-textual clustering on a second subset of t...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: LEVI, Avner, YEDIDIA, Maayan, HOFFMAN, Yonit
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Systems and methods for spatial-textual clustering-based recognition of text in videos are disclosed. A method includes performing textual clustering on a first subset of a set of predictions that correspond to numeric characters only and performing spatial-textual clustering on a second subset of the set of predictions that correspond to alphabetical characters only. The method includes, for each cluster of predictions associated with the first subset of the set of predictions, choosing a first cluster representative to correct any errors in each cluster of predictions associated with the first subset of the set of predictions and outputting any recognized numeric characters. The method includes, for each cluster of predictions associated with the second subset of the set of predictions, choosing a second cluster representative to correct any errors in each cluster of predictions associated with the second subset of the set of predictions and outputting any recognized alphabetical characters. Sont divulgués des systèmes et procédés de reconnaissance de texte dans des vidéos basée sur un regroupement textuel-spatial. Un procédé consiste à effectuer un regroupement textuel sur un premier sous-ensemble d'un ensemble de prédictions qui correspondent à des caractères numériques uniquement et à effectuer un regroupement spatial-textuel sur un second sous-ensemble de l'ensemble de prédictions qui correspondent uniquement à des caractères alphabétiques. Le procédé consiste, pour chaque grappe de prédictions associées au premier sous-ensemble de l'ensemble de prédictions, le choix d'un premier représentant de grappe pour corriger toute erreur dans chaque grappe de prédictions associées au premier sous-ensemble de l'ensemble de prédictions et à produire tous les caractères numériques reconnus. Le procédé consiste, pour chaque grappe de prédictions associées au second sous-ensemble de l'ensemble de prédictions, à choisir un second représentant de grappe pour corriger toute erreur dans chaque grappe de prédictions associées au second sous-ensemble de l'ensemble de prédictions et à produire tout caractère alphabétique reconnu.