UNCERTAINTY-AWARE INFERENCE OF 3D SHAPES FROM 2D IMAGES

Provided are computing systems, methods, and platforms that infer an object shape from an image using a neural radiance field (NeRF) model. A NeRF model can infer a 3D shape from a 2D image by performing a plurality of iterations to generate a plurality of sample 2D images of a 3D scene. For each it...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SOUNTSOV, Pavel, HOFFMAN, Matthew, LEE, Benjamin Sang, LEE, Tuan Anh, RIFKIN, Ryan, SUTER, Christopher
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Provided are computing systems, methods, and platforms that infer an object shape from an image using a neural radiance field (NeRF) model. A NeRF model can infer a 3D shape from a 2D image by performing a plurality of iterations to generate a plurality of sample 2D images of a 3D scene. For each iteration, an object code can be sampled from a posterior distribution of learned priors on NeRF models associated with the 3D scene, the object code can be processed with a hypernetwork to generate a set of NeRF weights from the object code, and a NeRF model with the set of NeRF weights predicted by the hypernetwork can generate a sample 2D image of the 3D scene. The sample 2D images generated during the iterations can be provided as an output. L'invention concerne des systèmes, des procédés et des plates-formes informatiques qui déduisent une forme d'un objet à partir d'une image à l'aide d'un modèle de champ de radiance neuronal (NeRF). Un modèle NeRF peut déduire une forme 3D à partir d'une image 2D en effectuant une pluralité d'itérations de façon à générer une pluralité d'images 2D échantillons d'une scène 3D. Pour chaque itération, un code d'objet peut être échantillonné à partir d'une distribution postérieure d'a priori par apprentissage sur des modèles NeRF associés à la scène 3D. Le code d'objet peut être traité avec un hyper-réseau de façon à générer un ensemble de pondérations NeRF à partir du code d'objet. Un modèle NeRF contenant l'ensemble de pondérations NeRF prédites par l'hyper-réseau peut générer une image 2D échantillon de la scène 3D. Les images 2D échantillons générées pendant les itérations peuvent être transmises à titre de sortie.