融合语步和文本多特征的科技论文结构化摘要生成
在移动互联网时代,移动阅读、碎片化阅读已经成为人们阅读的主流方式.在用户阅读过程中,提供摘要内容以提高阅读效率是解决信息过载问题的重要途径之一.科技研究论文文本长、内容广且包含领域知识,其摘要生成任务相比于新闻等普通文本更具有挑战性.本文提出了一种科技论文结构化摘要方法.首先,将科技论文划分为不同的语步;其次,分别对不同语步文本进行抽取式摘要,将文本多特征按权重融入TextRank算法的迭代计算过程中,引入MMR(maximal marginal relevance)算法对预选摘要集进行冗余处理;最后,使用依存句法分析对文本进行语义分析,进一步精简摘要,并组合成结构化摘要.研究结果表明,相比于...
Gespeichert in:
Veröffentlicht in: | 情报学报 2023, Vol.42 (10), p.1176-1186 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 1186 |
---|---|
container_issue | 10 |
container_start_page | 1176 |
container_title | 情报学报 |
container_volume | 42 |
creator | 习海旭 何胜 黄纯国 |
description | 在移动互联网时代,移动阅读、碎片化阅读已经成为人们阅读的主流方式.在用户阅读过程中,提供摘要内容以提高阅读效率是解决信息过载问题的重要途径之一.科技研究论文文本长、内容广且包含领域知识,其摘要生成任务相比于新闻等普通文本更具有挑战性.本文提出了一种科技论文结构化摘要方法.首先,将科技论文划分为不同的语步;其次,分别对不同语步文本进行抽取式摘要,将文本多特征按权重融入TextRank算法的迭代计算过程中,引入MMR(maximal marginal relevance)算法对预选摘要集进行冗余处理;最后,使用依存句法分析对文本进行语义分析,进一步精简摘要,并组合成结构化摘要.研究结果表明,相比于基准模型,该方法在不同语步的相关性、多样性和可读性指标提升上具有一定差异;结合人工评价发现,该方法在显著提升摘要多样性的同时,一定程度上提升了摘要的相关性和可读性. |
doi_str_mv | 10.3772/j.issn.1000-0135.2023.10.004 |
format | Article |
fullrecord | <record><control><sourceid>wanfang_jour</sourceid><recordid>TN_cdi_wanfang_journals_qbxb202310004</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><wanfj_id>qbxb202310004</wanfj_id><sourcerecordid>qbxb202310004</sourcerecordid><originalsourceid>FETCH-wanfang_journals_qbxb2023100043</originalsourceid><addsrcrecordid>eNpjYFAxNNAzNjc30s_SyywuztMzNDAw0DUwNDbVMzIwMgZy9QwMTFgYOOHiHAy8xcWZSQYGhgamhoYWFpwMTi_m9T6d0PFi_dpna5c-ndTzbFr7szlrni6Z9bxz59N9jc9ntTxfPvFZV8OLdbuAUs93T342r-Vpz7RnE2e8WNb4fMr8Zx0TeBhY0xJzilN5oTQ3g6qba4izh255Yl5aYl56fFZ-aVEeUCa-MKkiCeQykHtMjIlVBwB08Vj_</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>融合语步和文本多特征的科技论文结构化摘要生成</title><source>国家哲学社会科学学术期刊数据库 (National Social Sciences Database)</source><creator>习海旭 ; 何胜 ; 黄纯国</creator><creatorcontrib>习海旭 ; 何胜 ; 黄纯国</creatorcontrib><description>在移动互联网时代,移动阅读、碎片化阅读已经成为人们阅读的主流方式.在用户阅读过程中,提供摘要内容以提高阅读效率是解决信息过载问题的重要途径之一.科技研究论文文本长、内容广且包含领域知识,其摘要生成任务相比于新闻等普通文本更具有挑战性.本文提出了一种科技论文结构化摘要方法.首先,将科技论文划分为不同的语步;其次,分别对不同语步文本进行抽取式摘要,将文本多特征按权重融入TextRank算法的迭代计算过程中,引入MMR(maximal marginal relevance)算法对预选摘要集进行冗余处理;最后,使用依存句法分析对文本进行语义分析,进一步精简摘要,并组合成结构化摘要.研究结果表明,相比于基准模型,该方法在不同语步的相关性、多样性和可读性指标提升上具有一定差异;结合人工评价发现,该方法在显著提升摘要多样性的同时,一定程度上提升了摘要的相关性和可读性.</description><identifier>ISSN: 1000-0135</identifier><identifier>DOI: 10.3772/j.issn.1000-0135.2023.10.004</identifier><language>chi</language><publisher>南京理工大学经济管理学院信息管理系,南京 210094%江苏理工学院计算机工程学院,常州 213001</publisher><ispartof>情报学报, 2023, Vol.42 (10), p.1176-1186</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/qbxb/qbxb.jpg</thumbnail><link.rule.ids>314,778,782,4012,27906,27907,27908</link.rule.ids></links><search><creatorcontrib>习海旭</creatorcontrib><creatorcontrib>何胜</creatorcontrib><creatorcontrib>黄纯国</creatorcontrib><title>融合语步和文本多特征的科技论文结构化摘要生成</title><title>情报学报</title><description>在移动互联网时代,移动阅读、碎片化阅读已经成为人们阅读的主流方式.在用户阅读过程中,提供摘要内容以提高阅读效率是解决信息过载问题的重要途径之一.科技研究论文文本长、内容广且包含领域知识,其摘要生成任务相比于新闻等普通文本更具有挑战性.本文提出了一种科技论文结构化摘要方法.首先,将科技论文划分为不同的语步;其次,分别对不同语步文本进行抽取式摘要,将文本多特征按权重融入TextRank算法的迭代计算过程中,引入MMR(maximal marginal relevance)算法对预选摘要集进行冗余处理;最后,使用依存句法分析对文本进行语义分析,进一步精简摘要,并组合成结构化摘要.研究结果表明,相比于基准模型,该方法在不同语步的相关性、多样性和可读性指标提升上具有一定差异;结合人工评价发现,该方法在显著提升摘要多样性的同时,一定程度上提升了摘要的相关性和可读性.</description><issn>1000-0135</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2023</creationdate><recordtype>article</recordtype><recordid>eNpjYFAxNNAzNjc30s_SyywuztMzNDAw0DUwNDbVMzIwMgZy9QwMTFgYOOHiHAy8xcWZSQYGhgamhoYWFpwMTi_m9T6d0PFi_dpna5c-ndTzbFr7szlrni6Z9bxz59N9jc9ntTxfPvFZV8OLdbuAUs93T342r-Vpz7RnE2e8WNb4fMr8Zx0TeBhY0xJzilN5oTQ3g6qba4izh255Yl5aYl56fFZ-aVEeUCa-MKkiCeQykHtMjIlVBwB08Vj_</recordid><startdate>2023</startdate><enddate>2023</enddate><creator>习海旭</creator><creator>何胜</creator><creator>黄纯国</creator><general>南京理工大学经济管理学院信息管理系,南京 210094%江苏理工学院计算机工程学院,常州 213001</general><general>江苏理工学院计算机工程学院,常州 213001</general><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2023</creationdate><title>融合语步和文本多特征的科技论文结构化摘要生成</title><author>习海旭 ; 何胜 ; 黄纯国</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-wanfang_journals_qbxb2023100043</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2023</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>习海旭</creatorcontrib><creatorcontrib>何胜</creatorcontrib><creatorcontrib>黄纯国</creatorcontrib><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>情报学报</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>习海旭</au><au>何胜</au><au>黄纯国</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>融合语步和文本多特征的科技论文结构化摘要生成</atitle><jtitle>情报学报</jtitle><date>2023</date><risdate>2023</risdate><volume>42</volume><issue>10</issue><spage>1176</spage><epage>1186</epage><pages>1176-1186</pages><issn>1000-0135</issn><abstract>在移动互联网时代,移动阅读、碎片化阅读已经成为人们阅读的主流方式.在用户阅读过程中,提供摘要内容以提高阅读效率是解决信息过载问题的重要途径之一.科技研究论文文本长、内容广且包含领域知识,其摘要生成任务相比于新闻等普通文本更具有挑战性.本文提出了一种科技论文结构化摘要方法.首先,将科技论文划分为不同的语步;其次,分别对不同语步文本进行抽取式摘要,将文本多特征按权重融入TextRank算法的迭代计算过程中,引入MMR(maximal marginal relevance)算法对预选摘要集进行冗余处理;最后,使用依存句法分析对文本进行语义分析,进一步精简摘要,并组合成结构化摘要.研究结果表明,相比于基准模型,该方法在不同语步的相关性、多样性和可读性指标提升上具有一定差异;结合人工评价发现,该方法在显著提升摘要多样性的同时,一定程度上提升了摘要的相关性和可读性.</abstract><pub>南京理工大学经济管理学院信息管理系,南京 210094%江苏理工学院计算机工程学院,常州 213001</pub><doi>10.3772/j.issn.1000-0135.2023.10.004</doi></addata></record> |
fulltext | fulltext |
identifier | ISSN: 1000-0135 |
ispartof | 情报学报, 2023, Vol.42 (10), p.1176-1186 |
issn | 1000-0135 |
language | chi |
recordid | cdi_wanfang_journals_qbxb202310004 |
source | 国家哲学社会科学学术期刊数据库 (National Social Sciences Database) |
title | 融合语步和文本多特征的科技论文结构化摘要生成 |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-17T07%3A46%3A40IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E8%9E%8D%E5%90%88%E8%AF%AD%E6%AD%A5%E5%92%8C%E6%96%87%E6%9C%AC%E5%A4%9A%E7%89%B9%E5%BE%81%E7%9A%84%E7%A7%91%E6%8A%80%E8%AE%BA%E6%96%87%E7%BB%93%E6%9E%84%E5%8C%96%E6%91%98%E8%A6%81%E7%94%9F%E6%88%90&rft.jtitle=%E6%83%85%E6%8A%A5%E5%AD%A6%E6%8A%A5&rft.au=%E4%B9%A0%E6%B5%B7%E6%97%AD&rft.date=2023&rft.volume=42&rft.issue=10&rft.spage=1176&rft.epage=1186&rft.pages=1176-1186&rft.issn=1000-0135&rft_id=info:doi/10.3772/j.issn.1000-0135.2023.10.004&rft_dat=%3Cwanfang_jour%3Eqbxb202310004%3C/wanfang_jour%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_wanfj_id=qbxb202310004&rfr_iscdi=true |