Deep learning : neural networks for object detection

En la actualidad se está llevando a cabo unan gran mejoría en los sistemas basados en detección de objetos, con el incremento de potencia de las GPUS, cada vez es más viable realizar entrenamientos en conjuntos de datos lo suficientemente grandes como para lograr una buena precisión, los detectores...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Garcia Miñano, Alejandro, Universitat Autònoma de Barcelona. Escola d'Enginyeria
Format: Web Resource
Sprache:spa
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:En la actualidad se está llevando a cabo unan gran mejoría en los sistemas basados en detección de objetos, con el incremento de potencia de las GPUS, cada vez es más viable realizar entrenamientos en conjuntos de datos lo suficientemente grandes como para lograr una buena precisión, los detectores de una fase se están imponiendo ante los detectores de dos fases por su principal ventaja de obtener tiempos de inferencia mucho menores, esto abre una gran cantidad de usos para este tipo de detectores como pueden ser sistemas de vigilancia en tiempo real, control del tráfico. En este articulo se analiza el detector de una fase conocido como RetinaNet, que utiliza las técnicas ya conocidas por los detectores de una fase pero que introduce como novedad una función de error capaz de incrementar la precisión obtenida hasta este momento con los detectores de una fase, solventando el mayor problema que comparten todos ellos, que es el desbalanceo en la detección de objetos. Currently, object detection systems have been improved a lot, with the increasing power of GPUS, it is becoming more viable to train in a big enough datasets in order to reach a good precission, one-stage-detector are imposing against two-stage-detector due to their main advantage of taking much less inference time, this opens a lot of uses for that kind of detectors such as real-time surveillance systems,traffic control and so on. In this article we analyze RetinaNet, wich is a one-stage-detector that uses well-known techniques by one-stage-detectors but it also introduces a new loss function that allows the network to increase the precision obtained until that moment by the one-stage-detectors, solving the biggest problems that share all of them, which is the class unbalance in object detection. Actualment s'estan millorant molt els sistemes basats en detecció d'objectes, amb l'increment de potencia de les GPUS, cada cop es mes viable realitzar entrenaments amb conjunts de dades que siguin prou gran per aconsseguir una bona precissió, els detectors de una fase s'estan impossant contra els detectors de dues fases pel seu principal avantatge d'obtenir temps d'inferència molt menors, això obre una gran quantitat de usos per aquesta classe de detectors com poden ser sistemes de vigilància en temps real, control de tràfic, etc. En aquest article s'analitza el detector d'una fase conegut com RetinaNet, que utilitza les tècniques ja conegudes pels detectors d'una fase però que introdueix com a novetat