一种基于深度可分离卷积的VVC帧内编码快速块划分算法

最近，联合视频探索工作组（JVET）将通用视频编码（VVC）作为新一代视频编码标准，它利用复杂的四叉树加多类型树（QTMTT）划分结构有效地提升了编码性能，但也导致编码复杂度急剧攀升，大幅地增加了编码时间。为解决上述问题，提出了一种基于深度可分离卷积的VVC帧内编码快速块划分算法，将编码单元（CU）的原始像素值作为输入，利用轻量化的深度可分离卷积神经网络提取CU纹理信息特征指导CU的划分模式选择，实现精准的划分模式预测。该方案通过跳过低概率的划分模式，减少CU划分模式的遍历，大幅地降低编码器的复杂度。实验结果表明，所提算法在VTM 15.2平台上实现了18%～48%的编码时间节省，仅仅带来了平...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	电信科学 2023-07, Vol.39 (7), p.99-108
Hauptverfasser:	叶振, 王国相, 宋俊锋, 刘昊坤, 黎天送
Format:	Artikel
Sprache:	chi
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	最近，联合视频探索工作组（JVET）将通用视频编码（VVC）作为新一代视频编码标准，它利用复杂的四叉树加多类型树（QTMTT）划分结构有效地提升了编码性能，但也导致编码复杂度急剧攀升，大幅地增加了编码时间。为解决上述问题，提出了一种基于深度可分离卷积的VVC帧内编码快速块划分算法，将编码单元（CU）的原始像素值作为输入，利用轻量化的深度可分离卷积神经网络提取CU纹理信息特征指导CU的划分模式选择，实现精准的划分模式预测。该方案通过跳过低概率的划分模式，减少CU划分模式的遍历，大幅地降低编码器的复杂度。实验结果表明，所提算法在VTM 15.2平台上实现了18%～48%的编码时间节省，仅仅带来了平均0.15%的性能损失，并且轻量化的深度可分离卷积计算带来的额外复杂性也可以忽略不计。
ISSN:	1000-0801
DOI:	10.11959/j.issn.1000-0801.2023132