APPARATUS AND METHOD FOR DEEP LEARNING-BASED FEATURE MAP CODING IN MULTI-TASK SYSTEM FOR MACHINE VISION

Disclosed is an apparatus for deep learning-based feature map coding in a multi-task system for machine vision. The present embodiment provides a VCM coding apparatus and method for generating and compressing a common feature map, which is related to a multi-task implied by an original video, in ord...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KANG, Je Won, YOO, Chae Hwa, PARK, Seung Wook, LIM, Wha Pyeong
Format: Patent
Sprache:eng ; fre ; kor
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Disclosed is an apparatus for deep learning-based feature map coding in a multi-task system for machine vision. The present embodiment provides a VCM coding apparatus and method for generating and compressing a common feature map, which is related to a multi-task implied by an original video, in order to ensure relatively acceptable performance for both machine vision and human vision, and when improved performance than a case of using the common feature map is required, additionally generating and compressing a task-specific feature map. Est divulgué un appareil de codage de carte de caractéristiques basé sur l'apprentissage profond dans un système multitâche destiné à la vision artificielle. Le présent mode de réalisation concerne un appareil de codage VCM ainsi qu'un procédé de génération et de compression d'une carte de caractéristiques communes, en lien avec une multi-tâche impliquée par une vidéo d'origine, afin d'assurer des performances relativement acceptables pour la vision artificielle et la vision humaine et, lorsqu'une performance améliorée par rapport à un cas d'utilisation de la carte de caractéristiques communes est nécessaire, de génération et de compression supplémentaires d'une carte de caractéristiques spécifique à une tâche. 머신 비전을 위한 다중 태스크 시스템에서의 딥러닝 기반 특징맵 코딩 장치에 관한 개시로서, 본 실시예는, 머신 비전 및 인간의 시각 모두에 대해 비교적 용인할 수 있는 성능을 보장하기 위해, 원본 비디오가 함축하는 다중 태스크와 관련된 공통 특징맵을 생성하여 압축하되, 공통 특징맵을 이용하는 경우보다 개선된 성능이 필요 시, 태스크 특화 특징맵을 추가로 생성하여 압축하는 VCM 코딩 장치 및 방법을 제공한다.