CNN景象匹配算法的加速设计与FPGA实现

TP391; 基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力.但是,该算法有海量的计算与存储需求,导致在边缘端部署存在巨大困难.为了提升计算实时性,文中设计并实现了一种高效的边缘端加速计算方案.在分析算法的计算特性与整体架构的基础上,基于Winograd快速卷积方法,设计了一种面向特征匹配层的专用加速器,并提出了利用专用加速器与深度学习处理器流水线式计算特征匹配层和特征提取网络的整体加速方案.在Xilinx的ZCU102开发板上进行实验发现,专用加速器的峰值算力达到576GOPS,实际算力达422.08GOPS,DSP的使用效率达4.5Ope-ra...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:计算机科学 2023, Vol.50 (11), p.8-14
Hauptverfasser: 王晓峰, 李超然, 路坤锋, 栾天娇, 姚娜, 周辉, 谢宇嘉
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 14
container_issue 11
container_start_page 8
container_title 计算机科学
container_volume 50
creator 王晓峰
李超然
路坤锋
栾天娇
姚娜
周辉
谢宇嘉
description TP391; 基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力.但是,该算法有海量的计算与存储需求,导致在边缘端部署存在巨大困难.为了提升计算实时性,文中设计并实现了一种高效的边缘端加速计算方案.在分析算法的计算特性与整体架构的基础上,基于Winograd快速卷积方法,设计了一种面向特征匹配层的专用加速器,并提出了利用专用加速器与深度学习处理器流水线式计算特征匹配层和特征提取网络的整体加速方案.在Xilinx的ZCU102开发板上进行实验发现,专用加速器的峰值算力达到576GOPS,实际算力达422.08GOPS,DSP的使用效率达4.5Ope-ration/clock.加速计算系统的峰值算力达1 600GOPS,将CNN景象匹配算法的吞吐时延降低至157.89ms.实验结果表明,该加速计算方案能高效利用FPGA的计算资源,实现CNN景象匹配算法的实时计算.
doi_str_mv 10.11896/jsjkx.221100104
format Article
fullrecord <record><control><sourceid>wanfang_jour</sourceid><recordid>TN_cdi_wanfang_journals_jsjkx202311002</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><wanfj_id>jsjkx202311002</wanfj_id><sourcerecordid>jsjkx202311002</sourcerecordid><originalsourceid>FETCH-wanfang_journals_jsjkx2023110023</originalsourceid><addsrcrecordid>eNpjYJAwNNAzNLSwNNPPKs7KrtAzMjI0NDAwNDBhYeAEMox0DY3NIzgYeIuLM5MMjIzNTIDQkJPB0NnP79nM9S82Lnzas_Nla-_zddOfbZ76fFbL064FLxvmv1i378W6hU929LkFuDs-XTfved8GHgbWtMSc4lReKM3NoObmGuLsoVuemJeWmJcen5VfWpQHlIkHO8QIaBnIJUbGRCsEACalSdM</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>CNN景象匹配算法的加速设计与FPGA实现</title><source>DOAJ Directory of Open Access Journals</source><creator>王晓峰 ; 李超然 ; 路坤锋 ; 栾天娇 ; 姚娜 ; 周辉 ; 谢宇嘉</creator><creatorcontrib>王晓峰 ; 李超然 ; 路坤锋 ; 栾天娇 ; 姚娜 ; 周辉 ; 谢宇嘉</creatorcontrib><description>TP391; 基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力.但是,该算法有海量的计算与存储需求,导致在边缘端部署存在巨大困难.为了提升计算实时性,文中设计并实现了一种高效的边缘端加速计算方案.在分析算法的计算特性与整体架构的基础上,基于Winograd快速卷积方法,设计了一种面向特征匹配层的专用加速器,并提出了利用专用加速器与深度学习处理器流水线式计算特征匹配层和特征提取网络的整体加速方案.在Xilinx的ZCU102开发板上进行实验发现,专用加速器的峰值算力达到576GOPS,实际算力达422.08GOPS,DSP的使用效率达4.5Ope-ration/clock.加速计算系统的峰值算力达1 600GOPS,将CNN景象匹配算法的吞吐时延降低至157.89ms.实验结果表明,该加速计算方案能高效利用FPGA的计算资源,实现CNN景象匹配算法的实时计算.</description><identifier>ISSN: 1002-137X</identifier><identifier>DOI: 10.11896/jsjkx.221100104</identifier><language>chi</language><publisher>宇航智能控制技术国家级重点实验室 北京100854</publisher><ispartof>计算机科学, 2023, Vol.50 (11), p.8-14</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/jsjkx/jsjkx.jpg</thumbnail><link.rule.ids>314,776,780,860,4010,27900,27901,27902</link.rule.ids></links><search><creatorcontrib>王晓峰</creatorcontrib><creatorcontrib>李超然</creatorcontrib><creatorcontrib>路坤锋</creatorcontrib><creatorcontrib>栾天娇</creatorcontrib><creatorcontrib>姚娜</creatorcontrib><creatorcontrib>周辉</creatorcontrib><creatorcontrib>谢宇嘉</creatorcontrib><title>CNN景象匹配算法的加速设计与FPGA实现</title><title>计算机科学</title><description>TP391; 基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力.但是,该算法有海量的计算与存储需求,导致在边缘端部署存在巨大困难.为了提升计算实时性,文中设计并实现了一种高效的边缘端加速计算方案.在分析算法的计算特性与整体架构的基础上,基于Winograd快速卷积方法,设计了一种面向特征匹配层的专用加速器,并提出了利用专用加速器与深度学习处理器流水线式计算特征匹配层和特征提取网络的整体加速方案.在Xilinx的ZCU102开发板上进行实验发现,专用加速器的峰值算力达到576GOPS,实际算力达422.08GOPS,DSP的使用效率达4.5Ope-ration/clock.加速计算系统的峰值算力达1 600GOPS,将CNN景象匹配算法的吞吐时延降低至157.89ms.实验结果表明,该加速计算方案能高效利用FPGA的计算资源,实现CNN景象匹配算法的实时计算.</description><issn>1002-137X</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2023</creationdate><recordtype>article</recordtype><recordid>eNpjYJAwNNAzNLSwNNPPKs7KrtAzMjI0NDAwNDBhYeAEMox0DY3NIzgYeIuLM5MMjIzNTIDQkJPB0NnP79nM9S82Lnzas_Nla-_zddOfbZ76fFbL064FLxvmv1i378W6hU929LkFuDs-XTfved8GHgbWtMSc4lReKM3NoObmGuLsoVuemJeWmJcen5VfWpQHlIkHO8QIaBnIJUbGRCsEACalSdM</recordid><startdate>2023</startdate><enddate>2023</enddate><creator>王晓峰</creator><creator>李超然</creator><creator>路坤锋</creator><creator>栾天娇</creator><creator>姚娜</creator><creator>周辉</creator><creator>谢宇嘉</creator><general>宇航智能控制技术国家级重点实验室 北京100854</general><general>北京航天自动控制研究所 北京 100854</general><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2023</creationdate><title>CNN景象匹配算法的加速设计与FPGA实现</title><author>王晓峰 ; 李超然 ; 路坤锋 ; 栾天娇 ; 姚娜 ; 周辉 ; 谢宇嘉</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-wanfang_journals_jsjkx2023110023</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2023</creationdate><toplevel>online_resources</toplevel><creatorcontrib>王晓峰</creatorcontrib><creatorcontrib>李超然</creatorcontrib><creatorcontrib>路坤锋</creatorcontrib><creatorcontrib>栾天娇</creatorcontrib><creatorcontrib>姚娜</creatorcontrib><creatorcontrib>周辉</creatorcontrib><creatorcontrib>谢宇嘉</creatorcontrib><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>计算机科学</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>王晓峰</au><au>李超然</au><au>路坤锋</au><au>栾天娇</au><au>姚娜</au><au>周辉</au><au>谢宇嘉</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>CNN景象匹配算法的加速设计与FPGA实现</atitle><jtitle>计算机科学</jtitle><date>2023</date><risdate>2023</risdate><volume>50</volume><issue>11</issue><spage>8</spage><epage>14</epage><pages>8-14</pages><issn>1002-137X</issn><abstract>TP391; 基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力.但是,该算法有海量的计算与存储需求,导致在边缘端部署存在巨大困难.为了提升计算实时性,文中设计并实现了一种高效的边缘端加速计算方案.在分析算法的计算特性与整体架构的基础上,基于Winograd快速卷积方法,设计了一种面向特征匹配层的专用加速器,并提出了利用专用加速器与深度学习处理器流水线式计算特征匹配层和特征提取网络的整体加速方案.在Xilinx的ZCU102开发板上进行实验发现,专用加速器的峰值算力达到576GOPS,实际算力达422.08GOPS,DSP的使用效率达4.5Ope-ration/clock.加速计算系统的峰值算力达1 600GOPS,将CNN景象匹配算法的吞吐时延降低至157.89ms.实验结果表明,该加速计算方案能高效利用FPGA的计算资源,实现CNN景象匹配算法的实时计算.</abstract><pub>宇航智能控制技术国家级重点实验室 北京100854</pub><doi>10.11896/jsjkx.221100104</doi></addata></record>
fulltext fulltext
identifier ISSN: 1002-137X
ispartof 计算机科学, 2023, Vol.50 (11), p.8-14
issn 1002-137X
language chi
recordid cdi_wanfang_journals_jsjkx202311002
source DOAJ Directory of Open Access Journals
title CNN景象匹配算法的加速设计与FPGA实现
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-01T15%3A48%3A25IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=CNN%E6%99%AF%E8%B1%A1%E5%8C%B9%E9%85%8D%E7%AE%97%E6%B3%95%E7%9A%84%E5%8A%A0%E9%80%9F%E8%AE%BE%E8%AE%A1%E4%B8%8EFPGA%E5%AE%9E%E7%8E%B0&rft.jtitle=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%A7%91%E5%AD%A6&rft.au=%E7%8E%8B%E6%99%93%E5%B3%B0&rft.date=2023&rft.volume=50&rft.issue=11&rft.spage=8&rft.epage=14&rft.pages=8-14&rft.issn=1002-137X&rft_id=info:doi/10.11896/jsjkx.221100104&rft_dat=%3Cwanfang_jour%3Ejsjkx202311002%3C/wanfang_jour%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_wanfj_id=jsjkx202311002&rfr_iscdi=true