PDD: Partitioning DAG-Topology DNNs for Streaming Tasks

To enable the inference of high-precision deep neural networks (DNNs) on resource-constrained devices, DNN offloading has been widely explored in recent years. Some works have also integrated the chain-topology DNN (CDNN) offloading with pipeline processing to further reduce inference delay when pro...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:IEEE internet of things journal 2024-03, Vol.11 (6), p.9258-9268
Hauptverfasser: Wu, Liantao, Gao, Guoliang, Yu, Jing, Zhou, Fangtong, Yang, Yang, Wang, Tengfei
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!