자기 지도 트레이닝을 사용하여 트레이닝되는 머신 러닝 비디오 스크리닝 모델을 사용하는 비디오 스크리닝
자기 지도 트레이닝을 사용하여 트레이닝되는 트레이닝된 비디오 스크리닝 모델을 사용하는 비디오 콘텐츠 스크리닝은 트레이닝 비디오 내의 프레디케이트 시간적 세그먼트 및 기준 비디오 내의 대응하는 기준 시간적 세그먼트를 나타내는 프레디케이트 스크리닝 데이터를 획득하여, 트레이닝 비디오로부터 확장된 시간적 세그먼트에 대한 후보 스크리닝 데이터를 획득함으로써 트레이닝 데이터세트를 자동으로 생성하되, 확장된 시간적 세그먼트는 프레디케이트 시간적 세그먼트, 및 프레디케이트 시간적 세그먼트에 인접한 트레이닝 비디오로부터의 적어도 하나의 프레임을...
Gespeichert in:
Hauptverfasser: | , , |
---|---|
Format: | Patent |
Sprache: | kor |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 자기 지도 트레이닝을 사용하여 트레이닝되는 트레이닝된 비디오 스크리닝 모델을 사용하는 비디오 콘텐츠 스크리닝은 트레이닝 비디오 내의 프레디케이트 시간적 세그먼트 및 기준 비디오 내의 대응하는 기준 시간적 세그먼트를 나타내는 프레디케이트 스크리닝 데이터를 획득하여, 트레이닝 비디오로부터 확장된 시간적 세그먼트에 대한 후보 스크리닝 데이터를 획득함으로써 트레이닝 데이터세트를 자동으로 생성하되, 확장된 시간적 세그먼트는 프레디케이트 시간적 세그먼트, 및 프레디케이트 시간적 세그먼트에 인접한 트레이닝 비디오로부터의 적어도 하나의 프레임을 포함한다. 후보 스크리닝 데이터는 기준 비디오로부터의 스크리닝 프레임과 확장된 시간적 세그먼트로부터의 후보 프레임의 공간적 부분 간의 유사성을 나타낸다. 후보 서브프레임 간의 결정된 유사성이 결정된 것에 응답하여, 자동으로 생성된 트레이닝 데이터세트에, 후보 서브프레임과 스크리닝 프레임 간의 유사성을 나타내는 예시적인 데이터가 트레이닝되는 것을 포함한다.
Video content screening using a trained video screening model trained using self-supervised training includes automatically generating a training dataset by obtaining predicate screening data indicating a predicate temporal segment within a training video and a corresponding reference temporal segment within the reference video, obtaining candidate screening data for an extended temporal segment from the training video, wherein the extended temporal segment includes the predicate temporal segment and at least one frame from the training video adjacent to the predicate temporal segment, wherein the candidate screening data indicates a similarity between a screening frame from the reference video and a spatial portion of a candidate frame from the extended temporal segment, and, in response to a determination that a determined similarity between the candidate subframe including, in the automatically generated training dataset, training example data indicating the similarity between the candidate subframe and the screening frame. |
---|