Erzeugung von synthetischen Bildern zum Trainieren eines Neuronal-Netzwerkmodells

Ein Training tiefer Neuronal-Netzwerke erfordert eine große Menge an etikettierten Trainingsdaten. Herkömmlicherweise werden etikettierte Trainingsdaten durch Zusammentragen echter Bilder erzeugt, die manuell etikettiert werden, was sehr zeitaufwändig ist. Statt des manuellen Etikettierens eines Tra...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Hauptverfasser:	Brophy, Mark A, Jampani, Varun, Birchfield, Stanley Thomas, To, Thang Hong, Acuna Marrero, David Jesus, Anil, Cem, Tremblay, Jonathan, Parakash, Aayush
Format:	Patent
Sprache:	ger
Schlagworte:	CALCULATING COMPUTING COUNTING IMAGE DATA PROCESSING OR GENERATION, IN GENERAL PHYSICS
Online-Zugang:	Volltext bestellen
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	Ein Training tiefer Neuronal-Netzwerke erfordert eine große Menge an etikettierten Trainingsdaten. Herkömmlicherweise werden etikettierte Trainingsdaten durch Zusammentragen echter Bilder erzeugt, die manuell etikettiert werden, was sehr zeitaufwändig ist. Statt des manuellen Etikettierens eines Trainingsdatensatzes wird Domain-Randominisierungs-Technik verwendet, um Trainingsdaten zu erzeugen, die automatisch etikettiert werden. Die erzeugten Trainingsdaten können verwendet werden, um Neuronal-Netzwerke für Aufgaben der Objekterfassung und Segmentierung (Etikettierung) zu trainieren. In einer Ausführungsform umfassen die erzeugten Trainingsdaten synthetische Eingabebilder, die durch Rendern dreidimensionaler (3D) Objekte von Interesse in einer 3D-Szene erzeugt werden. In einer Ausführungsform umfassen die erzeugten Trainingsdaten synthetische Eingabebilder, die durch Rendern von 3D-Objekten von Interesse auf einem 2D-Hintergrundbild erzeugt werden. Die 3D-Objekte von Interesse sind Objekte, die ein Neuronal-Netzwerks trainiert wird, zu erfassen und/oder zu etikettieren. Training deep neural networks requires a large amount of labeled training data. Conventionally, labeled training data is generated by gathering real images that are manually labelled which is very time-consuming. Instead of manually labelling a training dataset, domain randomization technique is used generate training data that is automatically labeled. The generated training data may be used to train neural networks for object detection and segmentation (labelling) tasks. In an embodiment, the generated training data includes synthetic input images generated by rendering three-dimensional (3D) objects of interest in a 3D scene. In an embodiment, the generated training data includes synthetic input images generated by rendering 3D objects of interest on a 2D background image. The 3D objects of interest are objects that a neural network is trained to detect and/or label.