Désambiguïsation des entités spatiales par apprentissage actif

L’extraction de connaissances spatiales à partir de documents textuels peut être une tâche difficile du fait de l’ambiguïté propre au langage naturel. L’indisponibilité de gros volumes de données étiquetées rend difficile la mise-en-œuvre d’un processus de découverte automatique. Dans ce contexte, n...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Revue internationale de géomatique 2018-04, Vol.28 (2), p.163-189
Hauptverfasser: Chihaoui, Amal, Bouhafs, Asma, Roche, Mathieu, Teisseire, Maguelonne
Format: Artikel
Sprache:fre
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 189
container_issue 2
container_start_page 163
container_title Revue internationale de géomatique
container_volume 28
creator Chihaoui, Amal
Bouhafs, Asma
Roche, Mathieu
Teisseire, Maguelonne
description L’extraction de connaissances spatiales à partir de documents textuels peut être une tâche difficile du fait de l’ambiguïté propre au langage naturel. L’indisponibilité de gros volumes de données étiquetées rend difficile la mise-en-œuvre d’un processus de découverte automatique. Dans ce contexte, nous abordons le problème de la désambiguïsation des entités spatiales, entre « localisation » et « organisation », par apprentissage actif. D’abord, nous introduisons une méthode de résolution des toponymes basée sur une analyse lexicale et contextuelle. Ensuite, nous proposons une amélioration en intégrant un modèle d’apprentissage actif. Celui-ci permet de sélectionner automatiquement les données non étiquetées les plus informatives pour l’annotation humaine. Les expérimentations sont réalisées sur un corpus de « SemEval-2007 » en anglais et soulignent l’amélioration du modèle d’apprentissage initial avec un étiquetage réduit. Discovering spatial knowledge from texts could be a difficult task due to the ambiguity of textual documents written on natural language and the lack of large amounts of annotated data for the learning process. In this context, we address the problem of spatial entity desambiguation between “location” and “organisation” with active learning methods. First, we introduce a method based on lexical and contextual analysis. Second, we improve it by adding an active learning model, in order to automatically select the most informative unlabeled data to be annotated. Experimental setups are conducted on an english “SemEval-2007” corpus and demonstrate the effectiveness of the active learning methods to improve the initial learning model with small amounts of annotations.
doi_str_mv 10.3166/rig.2018.00053
format Article
fullrecord <record><control><sourceid>proquest_cross</sourceid><recordid>TN_cdi_proquest_journals_2167293215</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>2167293215</sourcerecordid><originalsourceid>FETCH-LOGICAL-c675-138693cedb51bb10ea7a4a91753c16caf6a2aaf17681d477e353121c02535b5c3</originalsourceid><addsrcrecordid>eNotkL1qwzAUhUVpoSbN2tnQ2a6uZF3ZY0h_IdAlu7hWZOOQ2K5kD32kTn2IvFiVptOFcz7OhY-xe-C5BMRH37W54FDmnHMlr1giADDTHPk1S0Agz1Sp1S1bhrCPCJdQIIqErZ5O34GOddfOp59AUzf06c6F1PVTN8UqDWMM6RCjkXxK4-jPVQjUupTs1DV37KahQ3DL_7tg25fn7fot23y8vq9Xm8yiVhnIEitp3a5WUNfAHWkqqAKtpAW01CAJogY0lrArtHZSSRBguVBS1crKBXu4zI5--JxdmMx-mH0fPxoBqEUlBahI5RfK-iEE7xoz-u5I_ssAN2dRJooyZ1HmT5T8Be96XO8</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype><pqid>2167293215</pqid></control><display><type>article</type><title>Désambiguïsation des entités spatiales par apprentissage actif</title><source>Alma/SFX Local Collection</source><creator>Chihaoui, Amal ; Bouhafs, Asma ; Roche, Mathieu ; Teisseire, Maguelonne</creator><contributor>Kergosien, Éric ; De Runz, Cyril ; Sallaberry, Christian</contributor><creatorcontrib>Chihaoui, Amal ; Bouhafs, Asma ; Roche, Mathieu ; Teisseire, Maguelonne ; Kergosien, Éric ; De Runz, Cyril ; Sallaberry, Christian</creatorcontrib><description>L’extraction de connaissances spatiales à partir de documents textuels peut être une tâche difficile du fait de l’ambiguïté propre au langage naturel. L’indisponibilité de gros volumes de données étiquetées rend difficile la mise-en-œuvre d’un processus de découverte automatique. Dans ce contexte, nous abordons le problème de la désambiguïsation des entités spatiales, entre « localisation » et « organisation », par apprentissage actif. D’abord, nous introduisons une méthode de résolution des toponymes basée sur une analyse lexicale et contextuelle. Ensuite, nous proposons une amélioration en intégrant un modèle d’apprentissage actif. Celui-ci permet de sélectionner automatiquement les données non étiquetées les plus informatives pour l’annotation humaine. Les expérimentations sont réalisées sur un corpus de « SemEval-2007 » en anglais et soulignent l’amélioration du modèle d’apprentissage initial avec un étiquetage réduit. Discovering spatial knowledge from texts could be a difficult task due to the ambiguity of textual documents written on natural language and the lack of large amounts of annotated data for the learning process. In this context, we address the problem of spatial entity desambiguation between “location” and “organisation” with active learning methods. First, we introduce a method based on lexical and contextual analysis. Second, we improve it by adding an active learning model, in order to automatically select the most informative unlabeled data to be annotated. Experimental setups are conducted on an english “SemEval-2007” corpus and demonstrate the effectiveness of the active learning methods to improve the initial learning model with small amounts of annotations.</description><identifier>ISSN: 1260-5875</identifier><identifier>EISSN: 2116-7060</identifier><identifier>DOI: 10.3166/rig.2018.00053</identifier><language>fre</language><publisher>Paris: Lavoisier</publisher><subject>Active learning ; Annotations ; Learning ; Teaching methods</subject><ispartof>Revue internationale de géomatique, 2018-04, Vol.28 (2), p.163-189</ispartof><rights>Copyright Lavoisier Apr-Jun 2018</rights><lds50>peer_reviewed</lds50><woscitedreferencessubscribed>false</woscitedreferencessubscribed><cites>FETCH-LOGICAL-c675-138693cedb51bb10ea7a4a91753c16caf6a2aaf17681d477e353121c02535b5c3</cites></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,780,784,27924,27925</link.rule.ids></links><search><contributor>Kergosien, Éric</contributor><contributor>De Runz, Cyril</contributor><contributor>Sallaberry, Christian</contributor><creatorcontrib>Chihaoui, Amal</creatorcontrib><creatorcontrib>Bouhafs, Asma</creatorcontrib><creatorcontrib>Roche, Mathieu</creatorcontrib><creatorcontrib>Teisseire, Maguelonne</creatorcontrib><title>Désambiguïsation des entités spatiales par apprentissage actif</title><title>Revue internationale de géomatique</title><description>L’extraction de connaissances spatiales à partir de documents textuels peut être une tâche difficile du fait de l’ambiguïté propre au langage naturel. L’indisponibilité de gros volumes de données étiquetées rend difficile la mise-en-œuvre d’un processus de découverte automatique. Dans ce contexte, nous abordons le problème de la désambiguïsation des entités spatiales, entre « localisation » et « organisation », par apprentissage actif. D’abord, nous introduisons une méthode de résolution des toponymes basée sur une analyse lexicale et contextuelle. Ensuite, nous proposons une amélioration en intégrant un modèle d’apprentissage actif. Celui-ci permet de sélectionner automatiquement les données non étiquetées les plus informatives pour l’annotation humaine. Les expérimentations sont réalisées sur un corpus de « SemEval-2007 » en anglais et soulignent l’amélioration du modèle d’apprentissage initial avec un étiquetage réduit. Discovering spatial knowledge from texts could be a difficult task due to the ambiguity of textual documents written on natural language and the lack of large amounts of annotated data for the learning process. In this context, we address the problem of spatial entity desambiguation between “location” and “organisation” with active learning methods. First, we introduce a method based on lexical and contextual analysis. Second, we improve it by adding an active learning model, in order to automatically select the most informative unlabeled data to be annotated. Experimental setups are conducted on an english “SemEval-2007” corpus and demonstrate the effectiveness of the active learning methods to improve the initial learning model with small amounts of annotations.</description><subject>Active learning</subject><subject>Annotations</subject><subject>Learning</subject><subject>Teaching methods</subject><issn>1260-5875</issn><issn>2116-7060</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2018</creationdate><recordtype>article</recordtype><sourceid>AFKRA</sourceid><sourceid>BENPR</sourceid><sourceid>CCPQU</sourceid><sourceid>DWQXO</sourceid><recordid>eNotkL1qwzAUhUVpoSbN2tnQ2a6uZF3ZY0h_IdAlu7hWZOOQ2K5kD32kTn2IvFiVptOFcz7OhY-xe-C5BMRH37W54FDmnHMlr1giADDTHPk1S0Agz1Sp1S1bhrCPCJdQIIqErZ5O34GOddfOp59AUzf06c6F1PVTN8UqDWMM6RCjkXxK4-jPVQjUupTs1DV37KahQ3DL_7tg25fn7fot23y8vq9Xm8yiVhnIEitp3a5WUNfAHWkqqAKtpAW01CAJogY0lrArtHZSSRBguVBS1crKBXu4zI5--JxdmMx-mH0fPxoBqEUlBahI5RfK-iEE7xoz-u5I_ssAN2dRJooyZ1HmT5T8Be96XO8</recordid><startdate>201804</startdate><enddate>201804</enddate><creator>Chihaoui, Amal</creator><creator>Bouhafs, Asma</creator><creator>Roche, Mathieu</creator><creator>Teisseire, Maguelonne</creator><general>Lavoisier</general><scope>AAYXX</scope><scope>CITATION</scope><scope>8FE</scope><scope>8FG</scope><scope>ABJCF</scope><scope>AFKRA</scope><scope>BENPR</scope><scope>BGLVJ</scope><scope>CCPQU</scope><scope>DWQXO</scope><scope>HCIFZ</scope><scope>L6V</scope><scope>M7S</scope><scope>PQEST</scope><scope>PQQKQ</scope><scope>PQUKI</scope><scope>PRINS</scope><scope>PTHSS</scope></search><sort><creationdate>201804</creationdate><title>Désambiguïsation des entités spatiales par apprentissage actif</title><author>Chihaoui, Amal ; Bouhafs, Asma ; Roche, Mathieu ; Teisseire, Maguelonne</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-c675-138693cedb51bb10ea7a4a91753c16caf6a2aaf17681d477e353121c02535b5c3</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>fre</language><creationdate>2018</creationdate><topic>Active learning</topic><topic>Annotations</topic><topic>Learning</topic><topic>Teaching methods</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Chihaoui, Amal</creatorcontrib><creatorcontrib>Bouhafs, Asma</creatorcontrib><creatorcontrib>Roche, Mathieu</creatorcontrib><creatorcontrib>Teisseire, Maguelonne</creatorcontrib><collection>CrossRef</collection><collection>ProQuest SciTech Collection</collection><collection>ProQuest Technology Collection</collection><collection>Materials Science &amp; Engineering Collection</collection><collection>ProQuest Central UK/Ireland</collection><collection>ProQuest Central</collection><collection>Technology Collection</collection><collection>ProQuest One Community College</collection><collection>ProQuest Central Korea</collection><collection>SciTech Premium Collection</collection><collection>ProQuest Engineering Collection</collection><collection>Engineering Database</collection><collection>ProQuest One Academic Eastern Edition (DO NOT USE)</collection><collection>ProQuest One Academic</collection><collection>ProQuest One Academic UKI Edition</collection><collection>ProQuest Central China</collection><collection>Engineering Collection</collection><jtitle>Revue internationale de géomatique</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Chihaoui, Amal</au><au>Bouhafs, Asma</au><au>Roche, Mathieu</au><au>Teisseire, Maguelonne</au><au>Kergosien, Éric</au><au>De Runz, Cyril</au><au>Sallaberry, Christian</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Désambiguïsation des entités spatiales par apprentissage actif</atitle><jtitle>Revue internationale de géomatique</jtitle><date>2018-04</date><risdate>2018</risdate><volume>28</volume><issue>2</issue><spage>163</spage><epage>189</epage><pages>163-189</pages><issn>1260-5875</issn><eissn>2116-7060</eissn><abstract>L’extraction de connaissances spatiales à partir de documents textuels peut être une tâche difficile du fait de l’ambiguïté propre au langage naturel. L’indisponibilité de gros volumes de données étiquetées rend difficile la mise-en-œuvre d’un processus de découverte automatique. Dans ce contexte, nous abordons le problème de la désambiguïsation des entités spatiales, entre « localisation » et « organisation », par apprentissage actif. D’abord, nous introduisons une méthode de résolution des toponymes basée sur une analyse lexicale et contextuelle. Ensuite, nous proposons une amélioration en intégrant un modèle d’apprentissage actif. Celui-ci permet de sélectionner automatiquement les données non étiquetées les plus informatives pour l’annotation humaine. Les expérimentations sont réalisées sur un corpus de « SemEval-2007 » en anglais et soulignent l’amélioration du modèle d’apprentissage initial avec un étiquetage réduit. Discovering spatial knowledge from texts could be a difficult task due to the ambiguity of textual documents written on natural language and the lack of large amounts of annotated data for the learning process. In this context, we address the problem of spatial entity desambiguation between “location” and “organisation” with active learning methods. First, we introduce a method based on lexical and contextual analysis. Second, we improve it by adding an active learning model, in order to automatically select the most informative unlabeled data to be annotated. Experimental setups are conducted on an english “SemEval-2007” corpus and demonstrate the effectiveness of the active learning methods to improve the initial learning model with small amounts of annotations.</abstract><cop>Paris</cop><pub>Lavoisier</pub><doi>10.3166/rig.2018.00053</doi><tpages>27</tpages></addata></record>
fulltext fulltext
identifier ISSN: 1260-5875
ispartof Revue internationale de géomatique, 2018-04, Vol.28 (2), p.163-189
issn 1260-5875
2116-7060
language fre
recordid cdi_proquest_journals_2167293215
source Alma/SFX Local Collection
subjects Active learning
Annotations
Learning
Teaching methods
title Désambiguïsation des entités spatiales par apprentissage actif
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-07T00%3A00%3A16IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-proquest_cross&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=D%C3%A9sambigu%C3%AFsation%20des%20entit%C3%A9s%20spatiales%20par%20apprentissage%20actif&rft.jtitle=Revue%20internationale%20de%20g%C3%A9omatique&rft.au=Chihaoui,%20Amal&rft.date=2018-04&rft.volume=28&rft.issue=2&rft.spage=163&rft.epage=189&rft.pages=163-189&rft.issn=1260-5875&rft.eissn=2116-7060&rft_id=info:doi/10.3166/rig.2018.00053&rft_dat=%3Cproquest_cross%3E2167293215%3C/proquest_cross%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_pqid=2167293215&rft_id=info:pmid/&rfr_iscdi=true