Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles

RésuméDans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d’images. Nous utilisons des régions d’images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de l...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Document numérique 2010, Vol.13 (1), p.211-227
Hauptverfasser: Pham, Trong-Ton, Maisonnasse, Loïc, Mulhem, Philippe, Gaussier, Eric
Format: Artikel
Sprache:fre
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 227
container_issue 1
container_start_page 211
container_title Document numérique
container_volume 13
creator Pham, Trong-Ton
Maisonnasse, Loïc
Mulhem, Philippe
Gaussier, Eric
description RésuméDans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d’images. Nous utilisons des régions d’images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées sont utilisées comme base d’apprentissage ou de test. Les résultats obtenus sur un problème de catégorisation d’images montrent (a) que la procédure automatique qui associe les concepts à une image est efficace, et (b) que l’utilisation des relations spatiales, en plus des concepts, permet d’améliorer la qualité de la classification. Cette approche présente donc une extension du modèle de langue classique en recherche d’information pour traiter le problème de recherche et de catégorisation d’images non annotées, représentées par des graphes.
doi_str_mv 10.3166/dn.13.1.211-227
format Article
fullrecord <record><control><sourceid>istex_cairn</sourceid><recordid>TN_cdi_istex_primary_ark_67375_HT0_RM80BMZT_R</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><cairnenc_id>DN_131_0211</cairnenc_id><sourcerecordid>ark_67375_HT0_RM80BMZT_R</sourcerecordid><originalsourceid>FETCH-LOGICAL-c134t-d12f0cd4819d3a4b7e8b099143c3726992860044271c0f4156d3e1ab49a00af83</originalsourceid><addsrcrecordid>eNpFkE1OwzAQhS1-JErpmm04QILHdux4CeWnSC1IVdmwsVzbKSmpW9kpghv1Hr0YFkVi82b05tNo5iF0CbigwPm19QXQAgoCkBMijlAPJKc5YGDHaCBFRQTjJKGCnKQZETIvk56h8xiXGPOKi7KHppO13e9al1mXLYLevLvMddnq32y1X2xdtllvQ-qz4Mzae93EqL35BaLZ77yL2WcTt65tXbxAp7Vuoxv81T56fbifDUf5-OXxaXgzzg1Q1uUWSI2NZRVISzWbC1fNsZTAqKGCcClJxTFmjAgwuGZQcksd6DmTGmNdV7SP8sPeJnbuS21Cs9LhW-nwobigolSjGVbTSYVvJ28zNU381YE3ugleLdNHPt2n7p4VUFA4BUl_ABc_Y20</addsrcrecordid><sourcetype>Publisher</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles</title><source>Cairn.info Free Access Journals-Revues en accès libre</source><creator>Pham, Trong-Ton ; Maisonnasse, Loïc ; Mulhem, Philippe ; Gaussier, Eric</creator><creatorcontrib>Pham, Trong-Ton ; Maisonnasse, Loïc ; Mulhem, Philippe ; Gaussier, Eric</creatorcontrib><description>RésuméDans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d’images. Nous utilisons des régions d’images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées sont utilisées comme base d’apprentissage ou de test. Les résultats obtenus sur un problème de catégorisation d’images montrent (a) que la procédure automatique qui associe les concepts à une image est efficace, et (b) que l’utilisation des relations spatiales, en plus des concepts, permet d’améliorer la qualité de la classification. Cette approche présente donc une extension du modèle de langue classique en recherche d’information pour traiter le problème de recherche et de catégorisation d’images non annotées, représentées par des graphes.</description><identifier>ISSN: 1279-5127</identifier><identifier>ISBN: 9782746231672</identifier><identifier>ISBN: 2746231670</identifier><identifier>EISSN: 1963-1014</identifier><identifier>DOI: 10.3166/dn.13.1.211-227</identifier><language>fre</language><publisher>Lavoisier</publisher><subject>catégorisation d’image ; graph representation ; image categorization ; image retrieval ; recherche d’image ; représentation de graphes</subject><ispartof>Document numérique, 2010, Vol.13 (1), p.211-227</ispartof><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,778,782,4012,23139,27906,27907,27908</link.rule.ids></links><search><creatorcontrib>Pham, Trong-Ton</creatorcontrib><creatorcontrib>Maisonnasse, Loïc</creatorcontrib><creatorcontrib>Mulhem, Philippe</creatorcontrib><creatorcontrib>Gaussier, Eric</creatorcontrib><title>Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles</title><title>Document numérique</title><description>RésuméDans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d’images. Nous utilisons des régions d’images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées sont utilisées comme base d’apprentissage ou de test. Les résultats obtenus sur un problème de catégorisation d’images montrent (a) que la procédure automatique qui associe les concepts à une image est efficace, et (b) que l’utilisation des relations spatiales, en plus des concepts, permet d’améliorer la qualité de la classification. Cette approche présente donc une extension du modèle de langue classique en recherche d’information pour traiter le problème de recherche et de catégorisation d’images non annotées, représentées par des graphes.</description><subject>catégorisation d’image</subject><subject>graph representation</subject><subject>image categorization</subject><subject>image retrieval</subject><subject>recherche d’image</subject><subject>représentation de graphes</subject><issn>1279-5127</issn><issn>1963-1014</issn><isbn>9782746231672</isbn><isbn>2746231670</isbn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2010</creationdate><recordtype>article</recordtype><recordid>eNpFkE1OwzAQhS1-JErpmm04QILHdux4CeWnSC1IVdmwsVzbKSmpW9kpghv1Hr0YFkVi82b05tNo5iF0CbigwPm19QXQAgoCkBMijlAPJKc5YGDHaCBFRQTjJKGCnKQZETIvk56h8xiXGPOKi7KHppO13e9al1mXLYLevLvMddnq32y1X2xdtllvQ-qz4Mzae93EqL35BaLZ77yL2WcTt65tXbxAp7Vuoxv81T56fbifDUf5-OXxaXgzzg1Q1uUWSI2NZRVISzWbC1fNsZTAqKGCcClJxTFmjAgwuGZQcksd6DmTGmNdV7SP8sPeJnbuS21Cs9LhW-nwobigolSjGVbTSYVvJ28zNU381YE3ugleLdNHPt2n7p4VUFA4BUl_ABc_Y20</recordid><startdate>2010</startdate><enddate>2010</enddate><creator>Pham, Trong-Ton</creator><creator>Maisonnasse, Loïc</creator><creator>Mulhem, Philippe</creator><creator>Gaussier, Eric</creator><general>Lavoisier</general><scope>BSCLL</scope></search><sort><creationdate>2010</creationdate><title>Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles</title><author>Pham, Trong-Ton ; Maisonnasse, Loïc ; Mulhem, Philippe ; Gaussier, Eric</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-c134t-d12f0cd4819d3a4b7e8b099143c3726992860044271c0f4156d3e1ab49a00af83</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>fre</language><creationdate>2010</creationdate><topic>catégorisation d’image</topic><topic>graph representation</topic><topic>image categorization</topic><topic>image retrieval</topic><topic>recherche d’image</topic><topic>représentation de graphes</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Pham, Trong-Ton</creatorcontrib><creatorcontrib>Maisonnasse, Loïc</creatorcontrib><creatorcontrib>Mulhem, Philippe</creatorcontrib><creatorcontrib>Gaussier, Eric</creatorcontrib><collection>Istex</collection><jtitle>Document numérique</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Pham, Trong-Ton</au><au>Maisonnasse, Loïc</au><au>Mulhem, Philippe</au><au>Gaussier, Eric</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles</atitle><jtitle>Document numérique</jtitle><date>2010</date><risdate>2010</risdate><volume>13</volume><issue>1</issue><spage>211</spage><epage>227</epage><pages>211-227</pages><issn>1279-5127</issn><eissn>1963-1014</eissn><isbn>9782746231672</isbn><isbn>2746231670</isbn><abstract>RésuméDans cet article, nous décrivons une méthode pour utiliser un modèle de langue sur des graphes pour la recherche et la catégorisation d’images. Nous utilisons des régions d’images (associées automatiquement à des concepts visuels), ainsi que des relations spatiales entre ces régions, lors de la construction de la représentation sous forme de graphe des images. Notre méthode gère différents scénarios, selon que des images isolées ou groupées sont utilisées comme base d’apprentissage ou de test. Les résultats obtenus sur un problème de catégorisation d’images montrent (a) que la procédure automatique qui associe les concepts à une image est efficace, et (b) que l’utilisation des relations spatiales, en plus des concepts, permet d’améliorer la qualité de la classification. Cette approche présente donc une extension du modèle de langue classique en recherche d’information pour traiter le problème de recherche et de catégorisation d’images non annotées, représentées par des graphes.</abstract><pub>Lavoisier</pub><doi>10.3166/dn.13.1.211-227</doi><tpages>17</tpages></addata></record>
fulltext fulltext
identifier ISSN: 1279-5127
ispartof Document numérique, 2010, Vol.13 (1), p.211-227
issn 1279-5127
1963-1014
language fre
recordid cdi_istex_primary_ark_67375_HT0_RM80BMZT_R
source Cairn.info Free Access Journals-Revues en accès libre
subjects catégorisation d’image
graph representation
image categorization
image retrieval
recherche d’image
représentation de graphes
title Modèle de graphe et modèle de langue pour la reconnaissance de scènes visuelles
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-16T17%3A56%3A58IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-istex_cairn&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Mod%C3%A8le%20de%20graphe%20et%20mod%C3%A8le%20de%20langue%20pour%20la%20reconnaissance%20de%20sc%C3%A8nes%20visuelles&rft.jtitle=Document%20num%C3%A9rique&rft.au=Pham,%20Trong-Ton&rft.date=2010&rft.volume=13&rft.issue=1&rft.spage=211&rft.epage=227&rft.pages=211-227&rft.issn=1279-5127&rft.eissn=1963-1014&rft.isbn=9782746231672&rft.isbn_list=2746231670&rft_id=info:doi/10.3166/dn.13.1.211-227&rft_dat=%3Cistex_cairn%3Eark_67375_HT0_RM80BMZT_R%3C/istex_cairn%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_cairnenc_id=DN_131_0211&rfr_iscdi=true