基于位置可学习视觉中心机制的零售商品检测方法

TP18; 针对零售商品包装变形和重叠使得难以有效捕捉显著且多样化的特征信息,导致检测精度不高的问题,设计了位置可学习视觉中心(LLVC,location learnable visual center)机制,对YOLOX-s进行改进,取得了更高的检测精度.为有效应对商品包装变形和重叠现象,首先,通过轻量级多层感知机融合不同特征通道上的信息,以充分捕获全局上下文信息;接着,通过设计的LLVC增强局部特征表示能力,并利用空间信息为局部特征分配可学习的权重,提高辨别性局部特征的关注程度;最后,将交并比(IoU,intersection over union)损失函数替换为中心交并比(CIoU,ce...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	物联网学报 2023, Vol.7 (4), p.142-152
Hauptverfasser:	吕晓华, 魏铭辰, 刘立波
Format:	Artikel
Sprache:	chi
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

container_end_page	152
container_issue	4
container_start_page	142
container_title	物联网学报
container_volume	7
creator	吕晓华魏铭辰刘立波
description	TP18; 针对零售商品包装变形和重叠使得难以有效捕捉显著且多样化的特征信息,导致检测精度不高的问题,设计了位置可学习视觉中心(LLVC,location learnable visual center)机制,对YOLOX-s进行改进,取得了更高的检测精度.为有效应对商品包装变形和重叠现象,首先,通过轻量级多层感知机融合不同特征通道上的信息,以充分捕获全局上下文信息;接着,通过设计的LLVC增强局部特征表示能力,并利用空间信息为局部特征分配可学习的权重,提高辨别性局部特征的关注程度;最后,将交并比(IoU,intersection over union)损失函数替换为中心交并比(CIoU,centered intersection over union),并在此基础上引入功率参数α,有效降低了漏检率.实验结果表明,所提方法在零售商品识别(RPC,retail product checkout)数据集上取得91.3%的准确率,相比YOLOX-s提高了2.2%,并优于目前主流的轻量级目标检测算法;同时每秒帧率(FPS,frame per second)为97 frame/s,模型大小为9.48 MB,能够在计算资源受限的场景下,准确且实时地进行零售商品检测.
doi_str_mv	10.11959/j.issn.2096-3750.2023.00366
format	Article
fullrecord	<record><control><sourceid>wanfang_jour</sourceid><recordid>TN_cdi_wanfang_journals_wlwxb202304013</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><wanfj_id>wlwxb202304013</wanfj_id><sourcerecordid>wlwxb202304013</sourcerecordid><originalsourceid>FETCH-wanfang_journals_wlwxb2023040133</originalsourceid><addsrcrecordid>eNpjYFAxNNAzNLQ0tdTP0sssLs7TMzKwNNM1Njc1ALKMjPUMDIzNzFgYOOHCHAy8xcWZSQamhsbmJoZmhpwMTk_n73qyq-_J3t7ne9c97V__dO2yJzsXvFje9mJ555Mda5_ub342Z9fTjm3PZ7W8nL3t6ZR1T6e2PZ3c-Gxxw7Ot3c-m7Xy2eSoPA2taYk5xKi-U5mZQc3MNcfbQLU_MS0vMS4_Pyi8tygPKxJfnlFckgVxmYGJgaGxMtEIAJslbtQ</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>基于位置可学习视觉中心机制的零售商品检测方法</title><source>DOAJ Directory of Open Access Journals</source><creator>吕晓华 ; 魏铭辰 ; 刘立波</creator><creatorcontrib>吕晓华 ; 魏铭辰 ; 刘立波</creatorcontrib><description>TP18; 针对零售商品包装变形和重叠使得难以有效捕捉显著且多样化的特征信息,导致检测精度不高的问题,设计了位置可学习视觉中心(LLVC,location learnable visual center)机制,对YOLOX-s进行改进,取得了更高的检测精度.为有效应对商品包装变形和重叠现象,首先,通过轻量级多层感知机融合不同特征通道上的信息,以充分捕获全局上下文信息;接着,通过设计的LLVC增强局部特征表示能力,并利用空间信息为局部特征分配可学习的权重,提高辨别性局部特征的关注程度;最后,将交并比(IoU,intersection over union)损失函数替换为中心交并比(CIoU,centered intersection over union),并在此基础上引入功率参数α,有效降低了漏检率.实验结果表明,所提方法在零售商品识别(RPC,retail product checkout)数据集上取得91.3%的准确率,相比YOLOX-s提高了2.2%,并优于目前主流的轻量级目标检测算法;同时每秒帧率(FPS,frame per second)为97 frame/s,模型大小为9.48 MB,能够在计算资源受限的场景下,准确且实时地进行零售商品检测.</description><identifier>ISSN: 2096-3750</identifier><identifier>DOI: 10.11959/j.issn.2096-3750.2023.00366</identifier><language>chi</language><publisher>宁夏大学信息工程学院,宁夏银川 750021</publisher><ispartof>物联网学报, 2023, Vol.7 (4), p.142-152</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/wlwxb/wlwxb.jpg</thumbnail><link.rule.ids>314,778,782,862,4012,27906,27907,27908</link.rule.ids></links><search><creatorcontrib>吕晓华</creatorcontrib><creatorcontrib>魏铭辰</creatorcontrib><creatorcontrib>刘立波</creatorcontrib><title>基于位置可学习视觉中心机制的零售商品检测方法</title><title>物联网学报</title><description>TP18; 针对零售商品包装变形和重叠使得难以有效捕捉显著且多样化的特征信息,导致检测精度不高的问题,设计了位置可学习视觉中心(LLVC,location learnable visual center)机制,对YOLOX-s进行改进,取得了更高的检测精度.为有效应对商品包装变形和重叠现象,首先,通过轻量级多层感知机融合不同特征通道上的信息,以充分捕获全局上下文信息;接着,通过设计的LLVC增强局部特征表示能力,并利用空间信息为局部特征分配可学习的权重,提高辨别性局部特征的关注程度;最后,将交并比(IoU,intersection over union)损失函数替换为中心交并比(CIoU,centered intersection over union),并在此基础上引入功率参数α,有效降低了漏检率.实验结果表明,所提方法在零售商品识别(RPC,retail product checkout)数据集上取得91.3%的准确率,相比YOLOX-s提高了2.2%,并优于目前主流的轻量级目标检测算法;同时每秒帧率(FPS,frame per second)为97 frame/s,模型大小为9.48 MB,能够在计算资源受限的场景下,准确且实时地进行零售商品检测.</description><issn>2096-3750</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2023</creationdate><recordtype>article</recordtype><recordid>eNpjYFAxNNAzNLQ0tdTP0sssLs7TMzKwNNM1Njc1ALKMjPUMDIzNzFgYOOHCHAy8xcWZSQamhsbmJoZmhpwMTk_n73qyq-_J3t7ne9c97V__dO2yJzsXvFje9mJ555Mda5_ub342Z9fTjm3PZ7W8nL3t6ZR1T6e2PZ3c-Gxxw7Ot3c-m7Xy2eSoPA2taYk5xKi-U5mZQc3MNcfbQLU_MS0vMS4_Pyi8tygPKxJfnlFckgVxmYGJgaGxMtEIAJslbtQ</recordid><startdate>2023</startdate><enddate>2023</enddate><creator>吕晓华</creator><creator>魏铭辰</creator><creator>刘立波</creator><general>宁夏大学信息工程学院,宁夏银川 750021</general><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2023</creationdate><title>基于位置可学习视觉中心机制的零售商品检测方法</title><author>吕晓华 ; 魏铭辰 ; 刘立波</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-wanfang_journals_wlwxb2023040133</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2023</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>吕晓华</creatorcontrib><creatorcontrib>魏铭辰</creatorcontrib><creatorcontrib>刘立波</creatorcontrib><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>物联网学报</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>吕晓华</au><au>魏铭辰</au><au>刘立波</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>基于位置可学习视觉中心机制的零售商品检测方法</atitle><jtitle>物联网学报</jtitle><date>2023</date><risdate>2023</risdate><volume>7</volume><issue>4</issue><spage>142</spage><epage>152</epage><pages>142-152</pages><issn>2096-3750</issn><abstract>TP18; 针对零售商品包装变形和重叠使得难以有效捕捉显著且多样化的特征信息,导致检测精度不高的问题,设计了位置可学习视觉中心(LLVC,location learnable visual center)机制,对YOLOX-s进行改进,取得了更高的检测精度.为有效应对商品包装变形和重叠现象,首先,通过轻量级多层感知机融合不同特征通道上的信息,以充分捕获全局上下文信息;接着,通过设计的LLVC增强局部特征表示能力,并利用空间信息为局部特征分配可学习的权重,提高辨别性局部特征的关注程度;最后,将交并比(IoU,intersection over union)损失函数替换为中心交并比(CIoU,centered intersection over union),并在此基础上引入功率参数α,有效降低了漏检率.实验结果表明,所提方法在零售商品识别(RPC,retail product checkout)数据集上取得91.3%的准确率,相比YOLOX-s提高了2.2%,并优于目前主流的轻量级目标检测算法;同时每秒帧率(FPS,frame per second)为97 frame/s,模型大小为9.48 MB,能够在计算资源受限的场景下,准确且实时地进行零售商品检测.</abstract><pub>宁夏大学信息工程学院,宁夏银川 750021</pub><doi>10.11959/j.issn.2096-3750.2023.00366</doi></addata></record>
fulltext	fulltext
identifier	ISSN: 2096-3750
ispartof	物联网学报, 2023, Vol.7 (4), p.142-152
issn	2096-3750
language	chi
recordid	cdi_wanfang_journals_wlwxb202304013
source	DOAJ Directory of Open Access Journals
title	基于位置可学习视觉中心机制的零售商品检测方法
url	https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-16T20%3A53%3A49IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E4%BD%8D%E7%BD%AE%E5%8F%AF%E5%AD%A6%E4%B9%A0%E8%A7%86%E8%A7%89%E4%B8%AD%E5%BF%83%E6%9C%BA%E5%88%B6%E7%9A%84%E9%9B%B6%E5%94%AE%E5%95%86%E5%93%81%E6%A3%80%E6%B5%8B%E6%96%B9%E6%B3%95&rft.jtitle=%E7%89%A9%E8%81%94%E7%BD%91%E5%AD%A6%E6%8A%A5&rft.au=%E5%90%95%E6%99%93%E5%8D%8E&rft.date=2023&rft.volume=7&rft.issue=4&rft.spage=142&rft.epage=152&rft.pages=142-152&rft.issn=2096-3750&rft_id=info:doi/10.11959/j.issn.2096-3750.2023.00366&rft_dat=%3Cwanfang_jour%3Ewlwxb202304013%3C/wanfang_jour%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_wanfj_id=wlwxb202304013&rfr_iscdi=true