Computing-aware network (CAN): a systematic design of computing and network convergence
摘要网络资源的覆盖范围日益广泛, 算力资源也逐渐成为能够提供泛在计算服务的基础设施. 然而, 在广域网络, 底层网络和计算资源缺乏密切的研究或协同设计, 仍然存在计算服务调度缓慢、 数据分发不灵活、 数据传输效率低等问题. 本文提出算力感知网络(CAN)的系统架构设计, 其核心贡献在于引入感知平面来收集、 管理并综合计算和网络的信息. 这样, 感知平面、控制平面和数据平面组成一个闭环控制系统, 增强了整个系统的感知能力、 决策能力和数据转发功能. 为了使能CAN系统, 本文提出三项关键技术: 算力路由、 弹性广播和广域高吞吐传输. 本文以人工智能(AI)模型训练、 推理和离线参数传输为例, 展...
Gespeichert in:
Veröffentlicht in: | Frontiers of information technology & electronic engineering 2024-05, Vol.25 (5), p.633-644 |
---|---|
Hauptverfasser: | , , , , , , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 摘要网络资源的覆盖范围日益广泛, 算力资源也逐渐成为能够提供泛在计算服务的基础设施. 然而, 在广域网络, 底层网络和计算资源缺乏密切的研究或协同设计, 仍然存在计算服务调度缓慢、 数据分发不灵活、 数据传输效率低等问题. 本文提出算力感知网络(CAN)的系统架构设计, 其核心贡献在于引入感知平面来收集、 管理并综合计算和网络的信息. 这样, 感知平面、控制平面和数据平面组成一个闭环控制系统, 增强了整个系统的感知能力、 决策能力和数据转发功能. 为了使能CAN系统, 本文提出三项关键技术: 算力路由、 弹性广播和广域高吞吐传输. 本文以人工智能(AI)模型训练、 推理和离线参数传输为例, 展示CAN的适用性, 并指出未来的一些研究方向. |
---|---|
ISSN: | 2095-9184 2095-9230 |
DOI: | 10.1631/FITEE.2400098 |