TECHNIQUES FOR DETECTING TEXT

In some examples, a system for detecting text in an image includes a memory device to store a text detection model trained using images of up-scaled text, and a processor configured to perform text detection on an image to generate original bounding boxes that identify potential text in the image. T...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: BARZELAY, Udi, AZULAI, Ophir, NAPARSTEK, Oshri
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:In some examples, a system for detecting text in an image includes a memory device to store a text detection model trained using images of up-scaled text, and a processor configured to perform text detection on an image to generate original bounding boxes that identify potential text in the image. The processor is also configured to generate a secondary image that includes up-scaled portions of the image associated with bounding boxes below a threshold size, and perform text detection on the secondary image to generate secondary bounding boxes that identify potential text in the secondary image. The processor is also configured to compare the original bounding boxes with the secondary bounding boxes to identify original bounding boxes that are false positives, and generate an image file that includes the original bounding boxes, wherein those original bounding boxes that are identified as false positives are removed. Dans certains exemples, la présente invention concerne un système de détection de texte dans une image, lequel système comprend un dispositif de mémoire pour stocker un modèle de détection de texte entraîné à l'aide d'images de texte mis à l'échelle supérieure, et un processeur configuré pour effectuer une détection de texte sur une image afin de générer des zones de délimitation d'origine qui identifient un texte potentiel dans l'image. Le processeur est également configuré pour générer une image secondaire qui comprend des parties mises à l'échelle supérieure de l'image associée à des zones de délimitation en dessous d'une taille de seuil, et pour effectuer une détection de texte sur l'image secondaire afin de générer des zones de délimitation secondaires qui identifient un texte potentiel dans l'image secondaire. Le processeur est également configuré pour comparer les zones de délimitation d'origine avec les zones de délimitation secondaires afin d'identifier des zones de délimitation d'origine qui sont des faux positifs, et pour générer un fichier d'image qui comprend les zones de délimitation d'origine, ces zones de délimitation d'origine qui sont identifiées comme étant des faux positifs étant supprimées.