中文文献引文情感语料库构建
基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文...
Gespeichert in:
Veröffentlicht in: | 情报学报 2020-01, Vol.39 (1), p.25-37 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 37 |
---|---|
container_issue | 1 |
container_start_page | 25 |
container_title | 情报学报 |
container_volume | 39 |
creator | 徐琳宏 丁堃 陈娜 李冰 |
description | 基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文网络分析和情感分析等相关领域的研究提供数据支撑。 |
doi_str_mv | 10.3772/j.issn.1000-0135.2020.01.003 |
format | Article |
fullrecord | <record><control><sourceid>cass_wanfa</sourceid><recordid>TN_cdi_wanfang_journals_qbxb202001003</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><cass_id>7100843533</cass_id><wanfj_id>qbxb202001003</wanfj_id><sourcerecordid>7100843533</sourcerecordid><originalsourceid>FETCH-LOGICAL-c503-9e42d2059038ae93c5b26073362ee8cb007d032fd0b7ab83561e61d1a31304da3</originalsourceid><addsrcrecordid>eNo9T01LAzEQzUHBUvsLvCqeNs5kNpvsUYpfUPDS-5JsstIiKxpE71a8eBMFL_UXqFep_Tnu6s8wpSIMvOG9x7w3jG0icFJK7Iz5KISaIwAkgCS5AAEckAPQCuv882usF8LIAiBIRK07bPvr47V9uovzff_WzB8X-81tO3n5eY_8czN7aKeT5nO2zlYrcxp87w-7bLi_N-wfJoPjg6P-7iApJVCS-1Q4ATIH0sbnVEorMlBEmfBelzFYOSBRObDKWE0yQ5-hQ0NIkDpDXba1PHtl6srUJ8X47PKijoHFub22i69idaDo21j6ShNCUYfgChUFnZIkol-S9FhE</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>中文文献引文情感语料库构建</title><source>国家哲学社会科学学术期刊数据库 (National Social Sciences Database)</source><creator>徐琳宏 ; 丁堃 ; 陈娜 ; 李冰</creator><creatorcontrib>徐琳宏 ; 丁堃 ; 陈娜 ; 李冰</creatorcontrib><description>基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文网络分析和情感分析等相关领域的研究提供数据支撑。</description><identifier>ISSN: 1000-0135</identifier><identifier>DOI: 10.3772/j.issn.1000-0135.2020.01.003</identifier><language>chi</language><publisher>中国科学技术信息研究所</publisher><ispartof>情报学报, 2020-01, Vol.39 (1), p.25-37</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/qbxb/qbxb.jpg</thumbnail><link.rule.ids>314,776,780,4009,27902,27903,27904</link.rule.ids></links><search><creatorcontrib>徐琳宏</creatorcontrib><creatorcontrib>丁堃</creatorcontrib><creatorcontrib>陈娜</creatorcontrib><creatorcontrib>李冰</creatorcontrib><title>中文文献引文情感语料库构建</title><title>情报学报</title><description>基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文网络分析和情感分析等相关领域的研究提供数据支撑。</description><issn>1000-0135</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2020</creationdate><recordtype>article</recordtype><recordid>eNo9T01LAzEQzUHBUvsLvCqeNs5kNpvsUYpfUPDS-5JsstIiKxpE71a8eBMFL_UXqFep_Tnu6s8wpSIMvOG9x7w3jG0icFJK7Iz5KISaIwAkgCS5AAEckAPQCuv882usF8LIAiBIRK07bPvr47V9uovzff_WzB8X-81tO3n5eY_8czN7aKeT5nO2zlYrcxp87w-7bLi_N-wfJoPjg6P-7iApJVCS-1Q4ATIH0sbnVEorMlBEmfBelzFYOSBRObDKWE0yQ5-hQ0NIkDpDXba1PHtl6srUJ8X47PKijoHFub22i69idaDo21j6ShNCUYfgChUFnZIkol-S9FhE</recordid><startdate>20200101</startdate><enddate>20200101</enddate><creator>徐琳宏</creator><creator>丁堃</creator><creator>陈娜</creator><creator>李冰</creator><general>中国科学技术信息研究所</general><general>中国科学技术情报学会</general><general>大连理工大学科学学与科技管理研究所暨WISE实验室,大连 116024</general><general>大连外国语大学软件学院,大连 116044%大连理工大学科学学与科技管理研究所暨WISE实验室,大连,116024</general><scope>NSCOK</scope><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>20200101</creationdate><title>中文文献引文情感语料库构建</title><author>徐琳宏 ; 丁堃 ; 陈娜 ; 李冰</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-c503-9e42d2059038ae93c5b26073362ee8cb007d032fd0b7ab83561e61d1a31304da3</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2020</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>徐琳宏</creatorcontrib><creatorcontrib>丁堃</creatorcontrib><creatorcontrib>陈娜</creatorcontrib><creatorcontrib>李冰</creatorcontrib><collection>国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation)</collection><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>情报学报</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>徐琳宏</au><au>丁堃</au><au>陈娜</au><au>李冰</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>中文文献引文情感语料库构建</atitle><jtitle>情报学报</jtitle><date>2020-01-01</date><risdate>2020</risdate><volume>39</volume><issue>1</issue><spage>25</spage><epage>37</epage><pages>25-37</pages><issn>1000-0135</issn><abstract>基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文网络分析和情感分析等相关领域的研究提供数据支撑。</abstract><pub>中国科学技术信息研究所</pub><doi>10.3772/j.issn.1000-0135.2020.01.003</doi><tpages>13</tpages><oa>free_for_read</oa></addata></record> |
fulltext | fulltext |
identifier | ISSN: 1000-0135 |
ispartof | 情报学报, 2020-01, Vol.39 (1), p.25-37 |
issn | 1000-0135 |
language | chi |
recordid | cdi_wanfang_journals_qbxb202001003 |
source | 国家哲学社会科学学术期刊数据库 (National Social Sciences Database) |
title | 中文文献引文情感语料库构建 |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-27T00%3A34%3A18IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-cass_wanfa&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E4%B8%AD%E6%96%87%E6%96%87%E7%8C%AE%E5%BC%95%E6%96%87%E6%83%85%E6%84%9F%E8%AF%AD%E6%96%99%E5%BA%93%E6%9E%84%E5%BB%BA&rft.jtitle=%E6%83%85%E6%8A%A5%E5%AD%A6%E6%8A%A5&rft.au=%E5%BE%90%E7%90%B3%E5%AE%8F&rft.date=2020-01-01&rft.volume=39&rft.issue=1&rft.spage=25&rft.epage=37&rft.pages=25-37&rft.issn=1000-0135&rft_id=info:doi/10.3772/j.issn.1000-0135.2020.01.003&rft_dat=%3Ccass_wanfa%3E7100843533%3C/cass_wanfa%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_cass_id=7100843533&rft_wanfj_id=qbxb202001003&rfr_iscdi=true |