基于学术论文全文内容的算法使用行为及其影响力研究

数据挖掘算法已被广泛应用于科学研究与实践中.考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法.本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力.具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估.实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:情报学报 2018, Vol.37 (12), p.1175-1187
Hauptverfasser: 章成志, 丁睿祎, 王玉琢
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 1187
container_issue 12
container_start_page 1175
container_title 情报学报
container_volume 37
creator 章成志
丁睿祎
王玉琢
description 数据挖掘算法已被广泛应用于科学研究与实践中.考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法.本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力.具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估.实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低.本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考.
doi_str_mv 10.3772/j.issn.1000-0135.2018.12.001
format Article
fullrecord <record><control><sourceid>wanfang_jour</sourceid><recordid>TN_cdi_wanfang_journals_qbxb201812001</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><wanfj_id>qbxb201812001</wanfj_id><sourcerecordid>qbxb201812001</sourcerecordid><originalsourceid>FETCH-wanfang_journals_qbxb2018120013</originalsourceid><addsrcrecordid>eNpjYFAxNNAzNjc30s_SyywuztMzNDAw0DUwNDbVMzIwtNAzNNIzMDBkYeCEi3Mw8BYXZyYBRQ1MDQ0tLDgZPJ7O3_VkV9_TtcuezVn_Yt2uZ9Pan7auAJFtrU_X7Xw-q-X5uunPNk99snf_8ykrXizsebJj19P-rqet257u3fh0cu_TrtnPF0x5vnIbDwNrWmJOcSovlOZmUHVzDXH20C1PzEtLzEuPz8ovLcoDysQXJlUkgdxnaAR0hzGx6gA25V6i</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>基于学术论文全文内容的算法使用行为及其影响力研究</title><source>国家哲学社会科学学术期刊数据库 (National Social Sciences Database)</source><creator>章成志 ; 丁睿祎 ; 王玉琢</creator><creatorcontrib>章成志 ; 丁睿祎 ; 王玉琢</creatorcontrib><description>数据挖掘算法已被广泛应用于科学研究与实践中.考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法.本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力.具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估.实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低.本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考.</description><identifier>ISSN: 1000-0135</identifier><identifier>DOI: 10.3772/j.issn.1000-0135.2018.12.001</identifier><language>chi</language><publisher>江苏省社会公共安全科技协同创新中心,南京 210094%南京理工大学经济管理学院信息管理系,南京 210094</publisher><ispartof>情报学报, 2018, Vol.37 (12), p.1175-1187</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/qbxb/qbxb.jpg</thumbnail><link.rule.ids>314,780,784,4024,27923,27924,27925</link.rule.ids></links><search><creatorcontrib>章成志</creatorcontrib><creatorcontrib>丁睿祎</creatorcontrib><creatorcontrib>王玉琢</creatorcontrib><title>基于学术论文全文内容的算法使用行为及其影响力研究</title><title>情报学报</title><description>数据挖掘算法已被广泛应用于科学研究与实践中.考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法.本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力.具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估.实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低.本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考.</description><issn>1000-0135</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2018</creationdate><recordtype>article</recordtype><recordid>eNpjYFAxNNAzNjc30s_SyywuztMzNDAw0DUwNDbVMzIwtNAzNNIzMDBkYeCEi3Mw8BYXZyYBRQ1MDQ0tLDgZPJ7O3_VkV9_TtcuezVn_Yt2uZ9Pan7auAJFtrU_X7Xw-q-X5uunPNk99snf_8ykrXizsebJj19P-rqet257u3fh0cu_TrtnPF0x5vnIbDwNrWmJOcSovlOZmUHVzDXH20C1PzEtLzEuPz8ovLcoDysQXJlUkgdxnaAR0hzGx6gA25V6i</recordid><startdate>2018</startdate><enddate>2018</enddate><creator>章成志</creator><creator>丁睿祎</creator><creator>王玉琢</creator><general>江苏省社会公共安全科技协同创新中心,南京 210094%南京理工大学经济管理学院信息管理系,南京 210094</general><general>江苏省社会公共安全科技协同创新中心,南京 210094</general><general>南京理工大学经济管理学院信息管理系,南京 210094</general><general>江苏省数据工程与知识服务重点实验室(南京大学),南京 210093</general><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2018</creationdate><title>基于学术论文全文内容的算法使用行为及其影响力研究</title><author>章成志 ; 丁睿祎 ; 王玉琢</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-wanfang_journals_qbxb2018120013</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2018</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>章成志</creatorcontrib><creatorcontrib>丁睿祎</creatorcontrib><creatorcontrib>王玉琢</creatorcontrib><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>情报学报</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>章成志</au><au>丁睿祎</au><au>王玉琢</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>基于学术论文全文内容的算法使用行为及其影响力研究</atitle><jtitle>情报学报</jtitle><date>2018</date><risdate>2018</risdate><volume>37</volume><issue>12</issue><spage>1175</spage><epage>1187</epage><pages>1175-1187</pages><issn>1000-0135</issn><abstract>数据挖掘算法已被广泛应用于科学研究与实践中.考察数据挖掘算法在学术论文中的使用情况、进而评估其影响力,能辅助研究者全面了解其所在领域的常用算法,并根据研究任务类型选择相应算法.本文利用学术论文全文内容,对算法的使用行为进行分析,从而考察算法的影响力.具体来说,本文以自然语言处理领域为例,收集整理全国计算语言学会议(CCL)1993—2016年收录的学术论文全文数据,从使用频次、使用位置、使用年代以及使用动机等四个方面全面考察十大经典数据挖掘算法在该领域的使用情况,并在此基础上对算法的影响力进行评估.实验结果显示,十大算法的使用行为存在明显差异,且SVM算法影响力最高,CART与Apriori算法影响力较低.本文研究可为基于数据驱动的相关研究者,尤其是为初学者在算法选择时提供参考.</abstract><pub>江苏省社会公共安全科技协同创新中心,南京 210094%南京理工大学经济管理学院信息管理系,南京 210094</pub><doi>10.3772/j.issn.1000-0135.2018.12.001</doi></addata></record>
fulltext fulltext
identifier ISSN: 1000-0135
ispartof 情报学报, 2018, Vol.37 (12), p.1175-1187
issn 1000-0135
language chi
recordid cdi_wanfang_journals_qbxb201812001
source 国家哲学社会科学学术期刊数据库 (National Social Sciences Database)
title 基于学术论文全文内容的算法使用行为及其影响力研究
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-01T16%3A09%3A59IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E5%AD%A6%E6%9C%AF%E8%AE%BA%E6%96%87%E5%85%A8%E6%96%87%E5%86%85%E5%AE%B9%E7%9A%84%E7%AE%97%E6%B3%95%E4%BD%BF%E7%94%A8%E8%A1%8C%E4%B8%BA%E5%8F%8A%E5%85%B6%E5%BD%B1%E5%93%8D%E5%8A%9B%E7%A0%94%E7%A9%B6&rft.jtitle=%E6%83%85%E6%8A%A5%E5%AD%A6%E6%8A%A5&rft.au=%E7%AB%A0%E6%88%90%E5%BF%97&rft.date=2018&rft.volume=37&rft.issue=12&rft.spage=1175&rft.epage=1187&rft.pages=1175-1187&rft.issn=1000-0135&rft_id=info:doi/10.3772/j.issn.1000-0135.2018.12.001&rft_dat=%3Cwanfang_jour%3Eqbxb201812001%3C/wanfang_jour%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_wanfj_id=qbxb201812001&rfr_iscdi=true