基于文本分类的政府网站信箱自动转递方法研究
TP39%G35; [目的]为改善政府网站领导信箱传统人工转递方式存在的人力、时间成本较高以及工作人员负担较重等问题,研究网站来信的自动转递方法.[方法]选择较有代表性的分类算法,包括朴素贝叶斯、决策树、随机森林以及多层神经网络,对北京、合肥和深圳的市长信箱文本数据进行对比实验,进而设计一套基于文本分类的政府网站信箱自动转递方法,并给出相应的应用建议.[结果]神经网络算法在市长信箱文本的分类表现最优,宏平均精确度和召回率均达0.85以上,且所有微平均指标均达0.93以上;朴素贝叶斯算法次之;随机森林算法的宏平均精确度很高,但召回率较差;决策树算法的精确度和召回率都较一般.[局限]未能兼顾来信数...
Gespeichert in:
Veröffentlicht in: | 数据分析与知识发现 2020, Vol.4 (6), p.51-59 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 59 |
---|---|
container_issue | 6 |
container_start_page | 51 |
container_title | 数据分析与知识发现 |
container_volume | 4 |
creator | 王思迪 胡广伟 杨巳煜 施云 |
description | TP39%G35; [目的]为改善政府网站领导信箱传统人工转递方式存在的人力、时间成本较高以及工作人员负担较重等问题,研究网站来信的自动转递方法.[方法]选择较有代表性的分类算法,包括朴素贝叶斯、决策树、随机森林以及多层神经网络,对北京、合肥和深圳的市长信箱文本数据进行对比实验,进而设计一套基于文本分类的政府网站信箱自动转递方法,并给出相应的应用建议.[结果]神经网络算法在市长信箱文本的分类表现最优,宏平均精确度和召回率均达0.85以上,且所有微平均指标均达0.93以上;朴素贝叶斯算法次之;随机森林算法的宏平均精确度很高,但召回率较差;决策树算法的精确度和召回率都较一般.[局限]未能兼顾来信数量不均衡对结果的影响,且实验时剔除了数据量过小的部门的来信数据,这在实际应用中可能会存在一定偏差.[结论]本文设计的政府网站信箱自动转递方法能够优化领导信箱运作机制,对提升线上政民互动效率,降低人力及行政成本具有积极意义. |
doi_str_mv | 10.11925/infotech.2096-3467.2019.1182 |
format | Article |
fullrecord | <record><control><sourceid>wanfang_jour</sourceid><recordid>TN_cdi_wanfang_journals_xdtsqbjs202006006</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><wanfj_id>xdtsqbjs202006006</wanfj_id><sourcerecordid>xdtsqbjs202006006</sourcerecordid><originalsourceid>FETCH-wanfang_journals_xdtsqbjs2020060063</originalsourceid><addsrcrecordid>eNpjYFA1NNAzNLQ0MtXPzEvLL0lNztAzMrA00zU2MTMHsgwtgbIWRiwMnHBRDgbe4uLMJANjAxNTYzMTS04G-6fzdz3Z1fdsWvuzOWuedrQ937j7-ayWZ1P2P9015_neic9Xz3yyf-HzdRtftK962rXixd41LxsmPZu289nmqc8XTHm-chsPA2taYk5xKi-U5mbQdHMNcfbQLU_MS0vMS4_Pyi8tygPKxFeklBQXJmUVGxkYGRiYAZExKWoBnutdJA</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>基于文本分类的政府网站信箱自动转递方法研究</title><source>国家哲学社会科学学术期刊数据库 (National Social Sciences Database)</source><creator>王思迪 ; 胡广伟 ; 杨巳煜 ; 施云</creator><creatorcontrib>王思迪 ; 胡广伟 ; 杨巳煜 ; 施云</creatorcontrib><description>TP39%G35; [目的]为改善政府网站领导信箱传统人工转递方式存在的人力、时间成本较高以及工作人员负担较重等问题,研究网站来信的自动转递方法.[方法]选择较有代表性的分类算法,包括朴素贝叶斯、决策树、随机森林以及多层神经网络,对北京、合肥和深圳的市长信箱文本数据进行对比实验,进而设计一套基于文本分类的政府网站信箱自动转递方法,并给出相应的应用建议.[结果]神经网络算法在市长信箱文本的分类表现最优,宏平均精确度和召回率均达0.85以上,且所有微平均指标均达0.93以上;朴素贝叶斯算法次之;随机森林算法的宏平均精确度很高,但召回率较差;决策树算法的精确度和召回率都较一般.[局限]未能兼顾来信数量不均衡对结果的影响,且实验时剔除了数据量过小的部门的来信数据,这在实际应用中可能会存在一定偏差.[结论]本文设计的政府网站信箱自动转递方法能够优化领导信箱运作机制,对提升线上政民互动效率,降低人力及行政成本具有积极意义.</description><identifier>ISSN: 2096-3467</identifier><identifier>DOI: 10.11925/infotech.2096-3467.2019.1182</identifier><language>chi</language><publisher>南京大学政务数据资源研究所 南京210023%南京大学信息管理学院 南京210023</publisher><ispartof>数据分析与知识发现, 2020, Vol.4 (6), p.51-59</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/xdtsqbjs/xdtsqbjs.jpg</thumbnail><link.rule.ids>314,780,784,4024,27923,27924,27925</link.rule.ids></links><search><creatorcontrib>王思迪</creatorcontrib><creatorcontrib>胡广伟</creatorcontrib><creatorcontrib>杨巳煜</creatorcontrib><creatorcontrib>施云</creatorcontrib><title>基于文本分类的政府网站信箱自动转递方法研究</title><title>数据分析与知识发现</title><description>TP39%G35; [目的]为改善政府网站领导信箱传统人工转递方式存在的人力、时间成本较高以及工作人员负担较重等问题,研究网站来信的自动转递方法.[方法]选择较有代表性的分类算法,包括朴素贝叶斯、决策树、随机森林以及多层神经网络,对北京、合肥和深圳的市长信箱文本数据进行对比实验,进而设计一套基于文本分类的政府网站信箱自动转递方法,并给出相应的应用建议.[结果]神经网络算法在市长信箱文本的分类表现最优,宏平均精确度和召回率均达0.85以上,且所有微平均指标均达0.93以上;朴素贝叶斯算法次之;随机森林算法的宏平均精确度很高,但召回率较差;决策树算法的精确度和召回率都较一般.[局限]未能兼顾来信数量不均衡对结果的影响,且实验时剔除了数据量过小的部门的来信数据,这在实际应用中可能会存在一定偏差.[结论]本文设计的政府网站信箱自动转递方法能够优化领导信箱运作机制,对提升线上政民互动效率,降低人力及行政成本具有积极意义.</description><issn>2096-3467</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2020</creationdate><recordtype>article</recordtype><recordid>eNpjYFA1NNAzNLQ0MtXPzEvLL0lNztAzMrA00zU2MTMHsgwtgbIWRiwMnHBRDgbe4uLMJANjAxNTYzMTS04G-6fzdz3Z1fdsWvuzOWuedrQ937j7-ayWZ1P2P9015_neic9Xz3yyf-HzdRtftK962rXixd41LxsmPZu289nmqc8XTHm-chsPA2taYk5xKi-U5mbQdHMNcfbQLU_MS0vMS4_Pyi8tygPKxFeklBQXJmUVGxkYGRiYAZExKWoBnutdJA</recordid><startdate>2020</startdate><enddate>2020</enddate><creator>王思迪</creator><creator>胡广伟</creator><creator>杨巳煜</creator><creator>施云</creator><general>南京大学政务数据资源研究所 南京210023%南京大学信息管理学院 南京210023</general><general>南京大学信息管理学院 南京210023</general><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2020</creationdate><title>基于文本分类的政府网站信箱自动转递方法研究</title><author>王思迪 ; 胡广伟 ; 杨巳煜 ; 施云</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-wanfang_journals_xdtsqbjs2020060063</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2020</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>王思迪</creatorcontrib><creatorcontrib>胡广伟</creatorcontrib><creatorcontrib>杨巳煜</creatorcontrib><creatorcontrib>施云</creatorcontrib><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>数据分析与知识发现</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>王思迪</au><au>胡广伟</au><au>杨巳煜</au><au>施云</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>基于文本分类的政府网站信箱自动转递方法研究</atitle><jtitle>数据分析与知识发现</jtitle><date>2020</date><risdate>2020</risdate><volume>4</volume><issue>6</issue><spage>51</spage><epage>59</epage><pages>51-59</pages><issn>2096-3467</issn><abstract>TP39%G35; [目的]为改善政府网站领导信箱传统人工转递方式存在的人力、时间成本较高以及工作人员负担较重等问题,研究网站来信的自动转递方法.[方法]选择较有代表性的分类算法,包括朴素贝叶斯、决策树、随机森林以及多层神经网络,对北京、合肥和深圳的市长信箱文本数据进行对比实验,进而设计一套基于文本分类的政府网站信箱自动转递方法,并给出相应的应用建议.[结果]神经网络算法在市长信箱文本的分类表现最优,宏平均精确度和召回率均达0.85以上,且所有微平均指标均达0.93以上;朴素贝叶斯算法次之;随机森林算法的宏平均精确度很高,但召回率较差;决策树算法的精确度和召回率都较一般.[局限]未能兼顾来信数量不均衡对结果的影响,且实验时剔除了数据量过小的部门的来信数据,这在实际应用中可能会存在一定偏差.[结论]本文设计的政府网站信箱自动转递方法能够优化领导信箱运作机制,对提升线上政民互动效率,降低人力及行政成本具有积极意义.</abstract><pub>南京大学政务数据资源研究所 南京210023%南京大学信息管理学院 南京210023</pub><doi>10.11925/infotech.2096-3467.2019.1182</doi></addata></record> |
fulltext | fulltext |
identifier | ISSN: 2096-3467 |
ispartof | 数据分析与知识发现, 2020, Vol.4 (6), p.51-59 |
issn | 2096-3467 |
language | chi |
recordid | cdi_wanfang_journals_xdtsqbjs202006006 |
source | 国家哲学社会科学学术期刊数据库 (National Social Sciences Database) |
title | 基于文本分类的政府网站信箱自动转递方法研究 |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-04T15%3A01%3A58IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB%E7%9A%84%E6%94%BF%E5%BA%9C%E7%BD%91%E7%AB%99%E4%BF%A1%E7%AE%B1%E8%87%AA%E5%8A%A8%E8%BD%AC%E9%80%92%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6&rft.jtitle=%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E4%B8%8E%E7%9F%A5%E8%AF%86%E5%8F%91%E7%8E%B0&rft.au=%E7%8E%8B%E6%80%9D%E8%BF%AA&rft.date=2020&rft.volume=4&rft.issue=6&rft.spage=51&rft.epage=59&rft.pages=51-59&rft.issn=2096-3467&rft_id=info:doi/10.11925/infotech.2096-3467.2019.1182&rft_dat=%3Cwanfang_jour%3Exdtsqbjs202006006%3C/wanfang_jour%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_wanfj_id=xdtsqbjs202006006&rfr_iscdi=true |