映像検索におけるディープラーニング

ディープラーニングは,画像の一般物体認識のタスクにおいて大成功を収めたことから,ビジョン系の多くの研究課題の中で用いられるようになってきた.近年では,画像の一般物体認識だけでなく,画像中にある物体を検出する,画像の説明文を生成する,画像の画風を変換するなど,様々な応用例が出てきている.また,静止画の認識だけに限らず,映像の意味理解や,映像検索の分野でも,多く使われるようになってきた.本稿では,大量映像からの検索技術を例に挙げ,そこで利用されている畳み込みニューラルネットワークと呼ばれるディープラーニングの活用方法を紹介する.現在,映像検索の学習に使用できる正解付けされた映像の量や質は,静止画に...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Nihon Shinkei Kairo Gakkai shi 2017/03/05, Vol.24(1), pp.13-26
1. Verfasser: 植木, 一也
Format: Artikel
Sprache:jpn
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:ディープラーニングは,画像の一般物体認識のタスクにおいて大成功を収めたことから,ビジョン系の多くの研究課題の中で用いられるようになってきた.近年では,画像の一般物体認識だけでなく,画像中にある物体を検出する,画像の説明文を生成する,画像の画風を変換するなど,様々な応用例が出てきている.また,静止画の認識だけに限らず,映像の意味理解や,映像検索の分野でも,多く使われるようになってきた.本稿では,大量映像からの検索技術を例に挙げ,そこで利用されている畳み込みニューラルネットワークと呼ばれるディープラーニングの活用方法を紹介する.現在,映像検索の学習に使用できる正解付けされた映像の量や質は,静止画に比べて十分ではないが,大量の静止画で学習された畳み込みニューラルネットワークから有益な特徴を抽出することで,映像検索の精度を向上させることが可能である.具体的な事例として,映像検索の中でも,映像に自動でタグ(意味索引)を付与する技術と,複数のキーワードの組み合わせからなるクエリ文を用いて映像を検索する技術を紹介する.
ISSN:1340-766X
1883-0455
DOI:10.3902/jnns.24.13