SYSTEMS AND METHODS FOR ENCODING TEMPORAL INFORMATION FOR VIDEO INSTANCE SEGMENTATION AND OBJECT DETECTION
Embodiments disclosed herein relate to video instance segmentation and video object detection, and more particularly to encoding of temporal information for stable video instance segmentation and video object detection. A neural network analyzes an input frame of a video to output a prediction templ...
Gespeichert in:
Hauptverfasser: | , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | |
---|---|
container_issue | |
container_start_page | |
container_title | |
container_volume | |
creator | IYER, Kiran Nanjunda DAS, Shouvik DAS, Biplab Ch BANDYOPADHYAY, Himadri Sekhar |
description | Embodiments disclosed herein relate to video instance segmentation and video object detection, and more particularly to encoding of temporal information for stable video instance segmentation and video object detection. A neural network analyzes an input frame of a video to output a prediction template. The prediction template either has segmentation masks of the objects in the input frame or has bounding boxes surrounding the objects in the input frame. The prediction template is then colour coded by a template generator. The colour coded template, along with the frame subsequent to the input frame, is fed to a template encoder such that temporal information from the input frame is encoded into the output of the temporal encoder.
Les modes de réalisation divulgués concernent la segmentation d'une instance vidéo et la détection d'un objet vidéo, plus précisément le codage d'informations temporelles permettant une segmentation d'une instance vidéo stable et une détection d'un objet vidéo. Un réseau neuronal analyse une image d'entrée d'une vidéo de façon à délivrer en sortie un modèle de prédiction. Le modèle de prédiction contient des masques de segmentation des objets dans l'image d'entrée ou des cadres de délimitation entourant les objets dans l'image d'entrée. Le modèle de prédiction est ensuite codé par couleurs par un générateur de modèle. Le modèle codé par couleurs est délivré à un codeur de modèle en même temps que l'image consécutive à l'image d'entrée, de sorte que les informations temporelles provenant de l'image d'entrée sont codées dans la sortie du codeur temporel. |
format | Patent |
fullrecord | <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2023224436A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2023224436A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2023224436A13</originalsourceid><addsrcrecordid>eNqNjMsKwjAQRbtxIeo_DLgWNC3uYzJtI2ZGmkFxVYrEhYgW6v9jfHyAqwPnHu44u4ZTEPQBNFnwKDXbACU3gGTYOqogrXtu9A4cJe-1OKZPcXAWOdkgmgxCwMojyXd_v_Fmi0bAoiQkOc1Gl-42xNmPk2xeoph6EftHG4e-O8d7fLZHVkuVK1UU-Vqv8v-qF4JlNzo</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>SYSTEMS AND METHODS FOR ENCODING TEMPORAL INFORMATION FOR VIDEO INSTANCE SEGMENTATION AND OBJECT DETECTION</title><source>esp@cenet</source><creator>IYER, Kiran Nanjunda ; DAS, Shouvik ; DAS, Biplab Ch ; BANDYOPADHYAY, Himadri Sekhar</creator><creatorcontrib>IYER, Kiran Nanjunda ; DAS, Shouvik ; DAS, Biplab Ch ; BANDYOPADHYAY, Himadri Sekhar</creatorcontrib><description>Embodiments disclosed herein relate to video instance segmentation and video object detection, and more particularly to encoding of temporal information for stable video instance segmentation and video object detection. A neural network analyzes an input frame of a video to output a prediction template. The prediction template either has segmentation masks of the objects in the input frame or has bounding boxes surrounding the objects in the input frame. The prediction template is then colour coded by a template generator. The colour coded template, along with the frame subsequent to the input frame, is fed to a template encoder such that temporal information from the input frame is encoded into the output of the temporal encoder.
Les modes de réalisation divulgués concernent la segmentation d'une instance vidéo et la détection d'un objet vidéo, plus précisément le codage d'informations temporelles permettant une segmentation d'une instance vidéo stable et une détection d'un objet vidéo. Un réseau neuronal analyse une image d'entrée d'une vidéo de façon à délivrer en sortie un modèle de prédiction. Le modèle de prédiction contient des masques de segmentation des objets dans l'image d'entrée ou des cadres de délimitation entourant les objets dans l'image d'entrée. Le modèle de prédiction est ensuite codé par couleurs par un générateur de modèle. Le modèle codé par couleurs est délivré à un codeur de modèle en même temps que l'image consécutive à l'image d'entrée, de sorte que les informations temporelles provenant de l'image d'entrée sont codées dans la sortie du codeur temporel.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS ; COMPUTING ; COUNTING ; PHYSICS</subject><creationdate>2023</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20231123&DB=EPODOC&CC=WO&NR=2023224436A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25563,76318</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&date=20231123&DB=EPODOC&CC=WO&NR=2023224436A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>IYER, Kiran Nanjunda</creatorcontrib><creatorcontrib>DAS, Shouvik</creatorcontrib><creatorcontrib>DAS, Biplab Ch</creatorcontrib><creatorcontrib>BANDYOPADHYAY, Himadri Sekhar</creatorcontrib><title>SYSTEMS AND METHODS FOR ENCODING TEMPORAL INFORMATION FOR VIDEO INSTANCE SEGMENTATION AND OBJECT DETECTION</title><description>Embodiments disclosed herein relate to video instance segmentation and video object detection, and more particularly to encoding of temporal information for stable video instance segmentation and video object detection. A neural network analyzes an input frame of a video to output a prediction template. The prediction template either has segmentation masks of the objects in the input frame or has bounding boxes surrounding the objects in the input frame. The prediction template is then colour coded by a template generator. The colour coded template, along with the frame subsequent to the input frame, is fed to a template encoder such that temporal information from the input frame is encoded into the output of the temporal encoder.
Les modes de réalisation divulgués concernent la segmentation d'une instance vidéo et la détection d'un objet vidéo, plus précisément le codage d'informations temporelles permettant une segmentation d'une instance vidéo stable et une détection d'un objet vidéo. Un réseau neuronal analyse une image d'entrée d'une vidéo de façon à délivrer en sortie un modèle de prédiction. Le modèle de prédiction contient des masques de segmentation des objets dans l'image d'entrée ou des cadres de délimitation entourant les objets dans l'image d'entrée. Le modèle de prédiction est ensuite codé par couleurs par un générateur de modèle. Le modèle codé par couleurs est délivré à un codeur de modèle en même temps que l'image consécutive à l'image d'entrée, de sorte que les informations temporelles provenant de l'image d'entrée sont codées dans la sortie du codeur temporel.</description><subject>CALCULATING</subject><subject>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2023</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNqNjMsKwjAQRbtxIeo_DLgWNC3uYzJtI2ZGmkFxVYrEhYgW6v9jfHyAqwPnHu44u4ZTEPQBNFnwKDXbACU3gGTYOqogrXtu9A4cJe-1OKZPcXAWOdkgmgxCwMojyXd_v_Fmi0bAoiQkOc1Gl-42xNmPk2xeoph6EftHG4e-O8d7fLZHVkuVK1UU-Vqv8v-qF4JlNzo</recordid><startdate>20231123</startdate><enddate>20231123</enddate><creator>IYER, Kiran Nanjunda</creator><creator>DAS, Shouvik</creator><creator>DAS, Biplab Ch</creator><creator>BANDYOPADHYAY, Himadri Sekhar</creator><scope>EVB</scope></search><sort><creationdate>20231123</creationdate><title>SYSTEMS AND METHODS FOR ENCODING TEMPORAL INFORMATION FOR VIDEO INSTANCE SEGMENTATION AND OBJECT DETECTION</title><author>IYER, Kiran Nanjunda ; DAS, Shouvik ; DAS, Biplab Ch ; BANDYOPADHYAY, Himadri Sekhar</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2023224436A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2023</creationdate><topic>CALCULATING</topic><topic>COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>IYER, Kiran Nanjunda</creatorcontrib><creatorcontrib>DAS, Shouvik</creatorcontrib><creatorcontrib>DAS, Biplab Ch</creatorcontrib><creatorcontrib>BANDYOPADHYAY, Himadri Sekhar</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>IYER, Kiran Nanjunda</au><au>DAS, Shouvik</au><au>DAS, Biplab Ch</au><au>BANDYOPADHYAY, Himadri Sekhar</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>SYSTEMS AND METHODS FOR ENCODING TEMPORAL INFORMATION FOR VIDEO INSTANCE SEGMENTATION AND OBJECT DETECTION</title><date>2023-11-23</date><risdate>2023</risdate><abstract>Embodiments disclosed herein relate to video instance segmentation and video object detection, and more particularly to encoding of temporal information for stable video instance segmentation and video object detection. A neural network analyzes an input frame of a video to output a prediction template. The prediction template either has segmentation masks of the objects in the input frame or has bounding boxes surrounding the objects in the input frame. The prediction template is then colour coded by a template generator. The colour coded template, along with the frame subsequent to the input frame, is fed to a template encoder such that temporal information from the input frame is encoded into the output of the temporal encoder.
Les modes de réalisation divulgués concernent la segmentation d'une instance vidéo et la détection d'un objet vidéo, plus précisément le codage d'informations temporelles permettant une segmentation d'une instance vidéo stable et une détection d'un objet vidéo. Un réseau neuronal analyse une image d'entrée d'une vidéo de façon à délivrer en sortie un modèle de prédiction. Le modèle de prédiction contient des masques de segmentation des objets dans l'image d'entrée ou des cadres de délimitation entourant les objets dans l'image d'entrée. Le modèle de prédiction est ensuite codé par couleurs par un générateur de modèle. Le modèle codé par couleurs est délivré à un codeur de modèle en même temps que l'image consécutive à l'image d'entrée, de sorte que les informations temporelles provenant de l'image d'entrée sont codées dans la sortie du codeur temporel.</abstract><oa>free_for_read</oa></addata></record> |
fulltext | fulltext_linktorsrc |
identifier | |
ispartof | |
issn | |
language | eng ; fre |
recordid | cdi_epo_espacenet_WO2023224436A1 |
source | esp@cenet |
subjects | CALCULATING COMPUTER SYSTEMS BASED ON SPECIFIC COMPUTATIONAL MODELS COMPUTING COUNTING PHYSICS |
title | SYSTEMS AND METHODS FOR ENCODING TEMPORAL INFORMATION FOR VIDEO INSTANCE SEGMENTATION AND OBJECT DETECTION |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-11T05%3A03%3A54IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=IYER,%20Kiran%20Nanjunda&rft.date=2023-11-23&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2023224436A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true |