网评贴文自动生成方法研究
【目的】为反制社交网络中的恶意信息、引导正确的舆论走向,提出一种时序序列生成式对抗网络(T-SeqGAN),实现网评贴文自动生成。【方法】通过将序列生成式对抗网络(SeqGAN)的生成器修改为Seq2Seq结构,分别以双向门控循环单元和时序卷积神经网络(TCN)作为其编码器与解码器的骨架网络的方式,提高生成贴文与真实网评贴文的语序结构及语义特征的相似性;通过将SeqGAN的判别器修改为TCN与注意力机制层相结合的模型的方式,提高生成贴文的语句通顺度。【结果】与基线模型相比,利用TSeqGAN生成的网评贴文BLEU-2(0.799 35)、BLEU-3(0.603 96)、BLEU-4(0.47...
Gespeichert in:
Veröffentlicht in: | 数据分析与知识发现 2023-04, Vol.7 (4), p.101-113 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 113 |
---|---|
container_issue | 4 |
container_start_page | 101 |
container_title | 数据分析与知识发现 |
container_volume | 7 |
creator | 刘欣然 徐雅斌 李继先 |
description | 【目的】为反制社交网络中的恶意信息、引导正确的舆论走向,提出一种时序序列生成式对抗网络(T-SeqGAN),实现网评贴文自动生成。【方法】通过将序列生成式对抗网络(SeqGAN)的生成器修改为Seq2Seq结构,分别以双向门控循环单元和时序卷积神经网络(TCN)作为其编码器与解码器的骨架网络的方式,提高生成贴文与真实网评贴文的语序结构及语义特征的相似性;通过将SeqGAN的判别器修改为TCN与注意力机制层相结合的模型的方式,提高生成贴文的语句通顺度。【结果】与基线模型相比,利用TSeqGAN生成的网评贴文BLEU-2(0.799 35)、BLEU-3(0.603 96)、BLEU-4(0.476 42)、KenLM(-27.670 29)指标值更高,PPL(0.752 47)指标值更低。【局限】生成贴文的词汇量及语言风格受制于已有的真实贴文,网评贴文自动生成方法的适用情景受限。【结论】本文模型生成的网评贴文具有更高的语序正确性和语法正确性,与真实贴文的内容相似性也更高,能够在社交网络中引导正确的舆论走向。 |
doi_str_mv | 10.11925/infotech.2096-3467.2022.0379 |
format | Article |
fullrecord | <record><control><sourceid>cass_wanfa</sourceid><recordid>TN_cdi_wanfang_journals_xdtsqbjs202304010</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><cass_id>SJFXYZSFX2023004012</cass_id><wanfj_id>xdtsqbjs202304010</wanfj_id><sourcerecordid>SJFXYZSFX2023004012</sourcerecordid><originalsourceid>FETCH-LOGICAL-c1330-20a99b95646400186cfdcb0f1a3828ea7c1a9d8a523fe57823c99e006d50ef393</originalsourceid><addsrcrecordid>eNo9j79KA0EYxLdQMMS8RSws7vx2v9u921KC8Q8BiyhEm2Nvb1cT5IJuRB9AiFgpxLRaqo2FQbDwcby7x_A0YjXD8GOGIWSFgk-pZHytn9nhyOhjn4EUHgYirBxjPmAoF0jtP10iDef6CSBnNBKhqJFm8XlXvl6Vs1k-HZfjl6-bp2LykF_f5tOP_O2-eJwUz-_LZNGqE2caf1on--2NvdaW19nd3G6tdzxNEcFjoKRMJBeBCACqAW1TnYClCiMWGRVqqmQaKc7QGh5GDLWUBkCkHIxFiXWyOu-9UJlV2VE8GJ6fZdVifJmO3GkycNUrhAAoVGxzzmrlXJw5l8bdnXbv4LDb7v1SPxjDbzndXLI</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>网评贴文自动生成方法研究</title><source>国家哲学社会科学学术期刊数据库 (National Social Sciences Database)</source><creator>刘欣然 ; 徐雅斌 ; 李继先</creator><creatorcontrib>刘欣然 ; 徐雅斌 ; 李继先</creatorcontrib><description>【目的】为反制社交网络中的恶意信息、引导正确的舆论走向,提出一种时序序列生成式对抗网络(T-SeqGAN),实现网评贴文自动生成。【方法】通过将序列生成式对抗网络(SeqGAN)的生成器修改为Seq2Seq结构,分别以双向门控循环单元和时序卷积神经网络(TCN)作为其编码器与解码器的骨架网络的方式,提高生成贴文与真实网评贴文的语序结构及语义特征的相似性;通过将SeqGAN的判别器修改为TCN与注意力机制层相结合的模型的方式,提高生成贴文的语句通顺度。【结果】与基线模型相比,利用TSeqGAN生成的网评贴文BLEU-2(0.799 35)、BLEU-3(0.603 96)、BLEU-4(0.476 42)、KenLM(-27.670 29)指标值更高,PPL(0.752 47)指标值更低。【局限】生成贴文的词汇量及语言风格受制于已有的真实贴文,网评贴文自动生成方法的适用情景受限。【结论】本文模型生成的网评贴文具有更高的语序正确性和语法正确性,与真实贴文的内容相似性也更高,能够在社交网络中引导正确的舆论走向。</description><identifier>ISSN: 2096-3467</identifier><identifier>DOI: 10.11925/infotech.2096-3467.2022.0379</identifier><language>chi</language><publisher>中国科学院文献情报中心</publisher><ispartof>数据分析与知识发现, 2023-04, Vol.7 (4), p.101-113</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://www.wanfangdata.com.cn/images/PeriodicalImages/xdtsqbjs/xdtsqbjs.jpg</thumbnail><link.rule.ids>314,776,780,27901,27902</link.rule.ids></links><search><creatorcontrib>刘欣然</creatorcontrib><creatorcontrib>徐雅斌</creatorcontrib><creatorcontrib>李继先</creatorcontrib><title>网评贴文自动生成方法研究</title><title>数据分析与知识发现</title><description>【目的】为反制社交网络中的恶意信息、引导正确的舆论走向,提出一种时序序列生成式对抗网络(T-SeqGAN),实现网评贴文自动生成。【方法】通过将序列生成式对抗网络(SeqGAN)的生成器修改为Seq2Seq结构,分别以双向门控循环单元和时序卷积神经网络(TCN)作为其编码器与解码器的骨架网络的方式,提高生成贴文与真实网评贴文的语序结构及语义特征的相似性;通过将SeqGAN的判别器修改为TCN与注意力机制层相结合的模型的方式,提高生成贴文的语句通顺度。【结果】与基线模型相比,利用TSeqGAN生成的网评贴文BLEU-2(0.799 35)、BLEU-3(0.603 96)、BLEU-4(0.476 42)、KenLM(-27.670 29)指标值更高,PPL(0.752 47)指标值更低。【局限】生成贴文的词汇量及语言风格受制于已有的真实贴文,网评贴文自动生成方法的适用情景受限。【结论】本文模型生成的网评贴文具有更高的语序正确性和语法正确性,与真实贴文的内容相似性也更高,能够在社交网络中引导正确的舆论走向。</description><issn>2096-3467</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2023</creationdate><recordtype>article</recordtype><recordid>eNo9j79KA0EYxLdQMMS8RSws7vx2v9u921KC8Q8BiyhEm2Nvb1cT5IJuRB9AiFgpxLRaqo2FQbDwcby7x_A0YjXD8GOGIWSFgk-pZHytn9nhyOhjn4EUHgYirBxjPmAoF0jtP10iDef6CSBnNBKhqJFm8XlXvl6Vs1k-HZfjl6-bp2LykF_f5tOP_O2-eJwUz-_LZNGqE2caf1on--2NvdaW19nd3G6tdzxNEcFjoKRMJBeBCACqAW1TnYClCiMWGRVqqmQaKc7QGh5GDLWUBkCkHIxFiXWyOu-9UJlV2VE8GJ6fZdVifJmO3GkycNUrhAAoVGxzzmrlXJw5l8bdnXbv4LDb7v1SPxjDbzndXLI</recordid><startdate>20230425</startdate><enddate>20230425</enddate><creator>刘欣然</creator><creator>徐雅斌</creator><creator>李继先</creator><general>中国科学院文献情报中心</general><general>北京信息科技大学计算机学院 北京100101%北京开放大学人文与教育学院 北京100081</general><general>北京信息科技大学网络文化与数字传播北京市重点实验室 北京100101</general><scope>NSCOK</scope><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>20230425</creationdate><title>网评贴文自动生成方法研究</title><author>刘欣然 ; 徐雅斌 ; 李继先</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-c1330-20a99b95646400186cfdcb0f1a3828ea7c1a9d8a523fe57823c99e006d50ef393</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2023</creationdate><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>刘欣然</creatorcontrib><creatorcontrib>徐雅斌</creatorcontrib><creatorcontrib>李继先</creatorcontrib><collection>国家哲学社会科学文献中心 (National Center for Philosophy and Social Sciences Documentation)</collection><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>数据分析与知识发现</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>刘欣然</au><au>徐雅斌</au><au>李继先</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>网评贴文自动生成方法研究</atitle><jtitle>数据分析与知识发现</jtitle><date>2023-04-25</date><risdate>2023</risdate><volume>7</volume><issue>4</issue><spage>101</spage><epage>113</epage><pages>101-113</pages><issn>2096-3467</issn><abstract>【目的】为反制社交网络中的恶意信息、引导正确的舆论走向,提出一种时序序列生成式对抗网络(T-SeqGAN),实现网评贴文自动生成。【方法】通过将序列生成式对抗网络(SeqGAN)的生成器修改为Seq2Seq结构,分别以双向门控循环单元和时序卷积神经网络(TCN)作为其编码器与解码器的骨架网络的方式,提高生成贴文与真实网评贴文的语序结构及语义特征的相似性;通过将SeqGAN的判别器修改为TCN与注意力机制层相结合的模型的方式,提高生成贴文的语句通顺度。【结果】与基线模型相比,利用TSeqGAN生成的网评贴文BLEU-2(0.799 35)、BLEU-3(0.603 96)、BLEU-4(0.476 42)、KenLM(-27.670 29)指标值更高,PPL(0.752 47)指标值更低。【局限】生成贴文的词汇量及语言风格受制于已有的真实贴文,网评贴文自动生成方法的适用情景受限。【结论】本文模型生成的网评贴文具有更高的语序正确性和语法正确性,与真实贴文的内容相似性也更高,能够在社交网络中引导正确的舆论走向。</abstract><pub>中国科学院文献情报中心</pub><doi>10.11925/infotech.2096-3467.2022.0379</doi><tpages>13</tpages><oa>free_for_read</oa></addata></record> |
fulltext | fulltext |
identifier | ISSN: 2096-3467 |
ispartof | 数据分析与知识发现, 2023-04, Vol.7 (4), p.101-113 |
issn | 2096-3467 |
language | chi |
recordid | cdi_wanfang_journals_xdtsqbjs202304010 |
source | 国家哲学社会科学学术期刊数据库 (National Social Sciences Database) |
title | 网评贴文自动生成方法研究 |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-02-02T07%3A16%3A56IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-cass_wanfa&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E7%BD%91%E8%AF%84%E8%B4%B4%E6%96%87%E8%87%AA%E5%8A%A8%E7%94%9F%E6%88%90%E6%96%B9%E6%B3%95%E7%A0%94%E7%A9%B6&rft.jtitle=%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E4%B8%8E%E7%9F%A5%E8%AF%86%E5%8F%91%E7%8E%B0&rft.au=%E5%88%98%E6%AC%A3%E7%84%B6&rft.date=2023-04-25&rft.volume=7&rft.issue=4&rft.spage=101&rft.epage=113&rft.pages=101-113&rft.issn=2096-3467&rft_id=info:doi/10.11925/infotech.2096-3467.2022.0379&rft_dat=%3Ccass_wanfa%3ESJFXYZSFX2023004012%3C/cass_wanfa%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_cass_id=SJFXYZSFX2023004012&rft_wanfj_id=xdtsqbjs202304010&rfr_iscdi=true |