Supervised Monocular Depth Estimation Based on Machine and Deep Learning Models
L'estimació de profunditat fa referència a mesurar la distància de cada píxel en relació amb la càmera. L'estimació de la profunditat és crucial per a moltes aplicacions, com ara la comprensió i reconstrucció d'escenes, la visió robotitzada i els cotxes autònoms. Els mapes de profundi...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Dissertation |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | L'estimació de profunditat fa referència a mesurar la distància de cada píxel en relació amb la càmera. L'estimació de
la profunditat és crucial per a moltes aplicacions, com ara la comprensió i reconstrucció d'escenes, la visió robotitzada
i els cotxes autònoms. Els mapes de profunditat es poden estimar mitjançant imatges estèreo o monoculars.
L'estimació de la profunditat es realitza normalment a través de la visió estèreo seguint diverses etapes que
requereixen temps, com ara la geometria epipolar, la rectificació i la concordança. Tanmateix, predir mapes de
profunditat a partir d'imatges RGB individuals encara és un repte, ja que s'han de deduir les formes dels objectes a
partir d'imatges d'intensitat fortament afectades pels canvis de punt de vista, el contingut de la textura i les condicions
de llum. A més, la càmera només captura una projecció en 2D del món 3D. Tot i que la mida aparent i la posició dels
objectes a la imatge poden variar significativament en funció de la seva distància a la càmera.
En conseqüència, aquesta tesi contribueix a dues línies de recerca en l'estimació de mapes de profunditat (també
coneguts com a imatges de profunditat): la primera línia estima la profunditat a partir de l'objecte present en una
escena per reduir la complexitat de l'escena completa. Així, hem desenvolupat noves tècniques i conceptes basats en
mètodes tradicionals i d'aprenentatge profund per aconseguir aquesta tasca.
La estimación de profundidad se refiere a medir la distancia de cada píxel en relación con la cámara. La estimación
de la profundidad es crucial para muchas aplicaciones como la comprensión y reconstrucción de escenas, la visión
robotizada y los coches autónomos. Los mapas de profundidad se pueden estimar mediante imágenes estéreo o
monoculares. La estimación de la profundidad se realiza normalmente a través de la visión estéreo siguiendo diversas
etapas que requieren tiempo, tales como la geometría epipolar, la rectificación y la concordancia. Sin embargo,
predecir mapas de profundidad a partir de imágenes RGB individuales todavía es un reto, ya que deben deducirse las
formas de los objetos a partir de imágenes de intensidad fuertemente afectadas por los cambios de punto de vista, el
contenido de la textura y las condiciones de luz. Además, la cámara sólo captura una proyección en 2D del mundo
3D. Aunque el tamaño aparente y la posición de los objetos en la imagen pueden variar significativamente en función
de su distancia a la cámara.
En co |
---|