基于查询词出现的相关度改进
对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来。对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法。我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度。实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到3468%。本文所描述的方法已经应用到TREC 2009的WebTrack中。...
Gespeichert in:
Veröffentlicht in: | Qing bao xue bao 2011, Vol.30 (4), p.361-365 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | chi |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 365 |
---|---|
container_issue | 4 |
container_start_page | 361 |
container_title | Qing bao xue bao |
container_volume | 30 |
creator | 赵东生 单栋栋 闫宏飞 |
description | 对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来。对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法。我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度。实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到3468%。本文所描述的方法已经应用到TREC 2009的WebTrack中。 |
doi_str_mv | 10.3772/j.issn.1000-0135.2011.04.004 |
format | Article |
fullrecord | <record><control><sourceid>wanfang_jour_chong</sourceid><recordid>TN_cdi_wanfang_journals_qbxb201104004</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><cqvip_id>37335757</cqvip_id><wanfj_id>qbxb201104004</wanfj_id><sourcerecordid>qbxb201104004</sourcerecordid><originalsourceid>FETCH-LOGICAL-c574-d36cbf8454ee7065fb461e951ead362561c37eb88f04c57feb5288d7fc2c9a823</originalsourceid><addsrcrecordid>eNo9j71KA0EUhadQMMS8hChWO97525mUEvwJBGzSLzOTmbgxbIiL6AMoVqayMkVA0DaCjW7jy7jZfQxHIlYHzvnOvRyEdglgJiU9GOE0zzNMACACwgSmQAgGjgH4Bmr8-1uoleepASAgCFGqgfbLRfFdzFaLl3r5XC8fyvuimr1VT7fV_KO8ey-L19XjZ_0130abXo9z1_rTJuofH_U7p1Hv7KTbOexFVkgeDVhsjVdccOckxMIbHhPXFsTpEFERE8ukM0p54KHgnRFUqYH0ltq2VpQ10d767LXOvM6GyWhydZmFh8nU3JjfVcDDpsDtrDl7PsmG0zSQRtsLn45dwiRjQgrJfgA0Hl1Q</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>基于查询词出现的相关度改进</title><source>国家哲学社会科学学术期刊数据库 (National Social Sciences Database)</source><creator>赵东生 单栋栋 闫宏飞</creator><creatorcontrib>赵东生 单栋栋 闫宏飞</creatorcontrib><description>对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来。对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法。我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度。实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到3468%。本文所描述的方法已经应用到TREC 2009的WebTrack中。</description><identifier>ISSN: 1000-0135</identifier><identifier>DOI: 10.3772/j.issn.1000-0135.2011.04.004</identifier><language>chi</language><publisher>北京大学信息科学技术学院,北京,100871</publisher><subject>信息检索 ; 相关度改进 ; 词出现</subject><ispartof>Qing bao xue bao, 2011, Vol.30 (4), p.361-365</ispartof><rights>Copyright © Wanfang Data Co. Ltd. All Rights Reserved.</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Uhttp://image.cqvip.com/vip1000/qk/95888X/95888X.jpg</thumbnail><link.rule.ids>314,780,784,4023,27922,27923,27924</link.rule.ids></links><search><creatorcontrib>赵东生 单栋栋 闫宏飞</creatorcontrib><title>基于查询词出现的相关度改进</title><title>Qing bao xue bao</title><addtitle>Journal of The China Society for Scientific and Technical Information</addtitle><description>对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来。对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法。我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度。实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到3468%。本文所描述的方法已经应用到TREC 2009的WebTrack中。</description><subject>信息检索</subject><subject>相关度改进</subject><subject>词出现</subject><issn>1000-0135</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2011</creationdate><recordtype>article</recordtype><recordid>eNo9j71KA0EUhadQMMS8hChWO97525mUEvwJBGzSLzOTmbgxbIiL6AMoVqayMkVA0DaCjW7jy7jZfQxHIlYHzvnOvRyEdglgJiU9GOE0zzNMACACwgSmQAgGjgH4Bmr8-1uoleepASAgCFGqgfbLRfFdzFaLl3r5XC8fyvuimr1VT7fV_KO8ey-L19XjZ_0130abXo9z1_rTJuofH_U7p1Hv7KTbOexFVkgeDVhsjVdccOckxMIbHhPXFsTpEFERE8ukM0p54KHgnRFUqYH0ltq2VpQ10d767LXOvM6GyWhydZmFh8nU3JjfVcDDpsDtrDl7PsmG0zSQRtsLn45dwiRjQgrJfgA0Hl1Q</recordid><startdate>2011</startdate><enddate>2011</enddate><creator>赵东生 单栋栋 闫宏飞</creator><general>北京大学信息科学技术学院,北京,100871</general><scope>2RA</scope><scope>92L</scope><scope>CQIGP</scope><scope>~WA</scope><scope>2B.</scope><scope>4A8</scope><scope>92I</scope><scope>93N</scope><scope>PSX</scope><scope>TCJ</scope></search><sort><creationdate>2011</creationdate><title>基于查询词出现的相关度改进</title><author>赵东生 单栋栋 闫宏飞</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-c574-d36cbf8454ee7065fb461e951ead362561c37eb88f04c57feb5288d7fc2c9a823</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>chi</language><creationdate>2011</creationdate><topic>信息检索</topic><topic>相关度改进</topic><topic>词出现</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>赵东生 单栋栋 闫宏飞</creatorcontrib><collection>中文科技期刊数据库</collection><collection>中文科技期刊数据库-CALIS站点</collection><collection>中文科技期刊数据库-7.0平台</collection><collection>中文科技期刊数据库- 镜像站点</collection><collection>Wanfang Data Journals - Hong Kong</collection><collection>WANFANG Data Centre</collection><collection>Wanfang Data Journals</collection><collection>万方数据期刊 - 香港版</collection><collection>China Online Journals (COJ)</collection><collection>China Online Journals (COJ)</collection><jtitle>Qing bao xue bao</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>赵东生 单栋栋 闫宏飞</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>基于查询词出现的相关度改进</atitle><jtitle>Qing bao xue bao</jtitle><addtitle>Journal of The China Society for Scientific and Technical Information</addtitle><date>2011</date><risdate>2011</risdate><volume>30</volume><issue>4</issue><spage>361</spage><epage>365</epage><pages>361-365</pages><issn>1000-0135</issn><abstract>对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容。本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来。对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法。我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度。实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到3468%。本文所描述的方法已经应用到TREC 2009的WebTrack中。</abstract><pub>北京大学信息科学技术学院,北京,100871</pub><doi>10.3772/j.issn.1000-0135.2011.04.004</doi><tpages>5</tpages></addata></record> |
fulltext | fulltext |
identifier | ISSN: 1000-0135 |
ispartof | Qing bao xue bao, 2011, Vol.30 (4), p.361-365 |
issn | 1000-0135 |
language | chi |
recordid | cdi_wanfang_journals_qbxb201104004 |
source | 国家哲学社会科学学术期刊数据库 (National Social Sciences Database) |
subjects | 信息检索 相关度改进 词出现 |
title | 基于查询词出现的相关度改进 |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-08T20%3A34%3A08IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-wanfang_jour_chong&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=%E5%9F%BA%E4%BA%8E%E6%9F%A5%E8%AF%A2%E8%AF%8D%E5%87%BA%E7%8E%B0%E7%9A%84%E7%9B%B8%E5%85%B3%E5%BA%A6%E6%94%B9%E8%BF%9B&rft.jtitle=Qing%20bao%20xue%20bao&rft.au=%E8%B5%B5%E4%B8%9C%E7%94%9F%20%E5%8D%95%E6%A0%8B%E6%A0%8B%20%E9%97%AB%E5%AE%8F%E9%A3%9E&rft.date=2011&rft.volume=30&rft.issue=4&rft.spage=361&rft.epage=365&rft.pages=361-365&rft.issn=1000-0135&rft_id=info:doi/10.3772/j.issn.1000-0135.2011.04.004&rft_dat=%3Cwanfang_jour_chong%3Eqbxb201104004%3C/wanfang_jour_chong%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_cqvip_id=37335757&rft_wanfj_id=qbxb201104004&rfr_iscdi=true |