CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO
RESUMO A complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam...
Gespeichert in:
Veröffentlicht in: | Alfa 2018-03, Vol.62 (1), p.125-150 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | eng ; por |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 150 |
---|---|
container_issue | 1 |
container_start_page | 125 |
container_title | Alfa |
container_volume | 62 |
creator | SOUZA, Jackson Wilke da Cruz FELIPPO, Ariani Di |
description | RESUMO A complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam a complementaridade temporal (Historical background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do Brasil que são baseados na CST. |
doi_str_mv | 10.1590/1981-5794-1804-6 |
format | Article |
fullrecord | <record><control><sourceid>scielo_doaj_</sourceid><recordid>TN_cdi_scielo_journals_S1981_57942018000100125</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><scielo_id>S1981_57942018000100125</scielo_id><doaj_id>oai_doaj_org_article_e104e28bb9bb45408252c05f4dfa3e19</doaj_id><sourcerecordid>S1981_57942018000100125</sourcerecordid><originalsourceid>FETCH-LOGICAL-d1476-79eaa4d4f612e9df30cca25c53e6ac5cb9d0f7c07dc90bbb4ad86fb0fe2dea623</originalsourceid><addsrcrecordid>eNpFkM9OhDAQhzlo4rp698gLsLalBeqtAioJ2A1_Ll6a0hZls4oBPXg0Hjz5VLyYXddoMslkfpn5Mvkc5wyCFSQUnEMaQY-EFHswAtgLDpzFX3TkHE_TBgAYUYgWzkPMShbXaZndsflz_uBuwtyYF-s8LdLbmpVZwpLUrdNizUuWX7hVc1nNX0nGK3dtT-1csP9j1tS8mN_rLGZu0eR1lvC42YH4iXPYye1kTn_70mmu0jq-8XJ-bbdzT0McBl5IjZRY4y6AyFDd-UApiYgivgmkIqqlGnShAqFWFLRti6WOgq4FnUHayAD5Syfbc_UgN-J57B_l-CYG2YufYBjvhRxferU1wkCADYralloOwSBCBClAOqw76RtILWu1Z02qN9tBbIbX8ck-L6qdTrHTiaxIYG3aQsT_BqxSbts</addsrcrecordid><sourcetype>Open Website</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO</title><source>DOAJ Directory of Open Access Journals</source><source>Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals</source><source>IngentaConnect Free/Open Access Journals</source><creator>SOUZA, Jackson Wilke da Cruz ; FELIPPO, Ariani Di</creator><creatorcontrib>SOUZA, Jackson Wilke da Cruz ; FELIPPO, Ariani Di</creatorcontrib><description>RESUMO A complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam a complementaridade temporal (Historical background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do Brasil que são baseados na CST.</description><identifier>ISSN: 1981-5794</identifier><identifier>DOI: 10.1590/1981-5794-1804-6</identifier><language>eng ; por</language><publisher>Universidade Estadual Paulista Júlio de Mesquita Filho</publisher><subject>Complementaridade ; CST ; Descrição linguística ; LANGUAGE & LINGUISTICS ; LINGUISTICS ; Processamento Automático de Língua Natural ; Sumarização Multidocumento</subject><ispartof>Alfa, 2018-03, Vol.62 (1), p.125-150</ispartof><rights>This work is licensed under a Creative Commons Attribution 4.0 International License.</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>230,314,780,784,864,885,27915,27916</link.rule.ids></links><search><creatorcontrib>SOUZA, Jackson Wilke da Cruz</creatorcontrib><creatorcontrib>FELIPPO, Ariani Di</creatorcontrib><title>CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO</title><title>Alfa</title><addtitle>Alfa, rev. linguíst. (São José Rio Preto)</addtitle><description>RESUMO A complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam a complementaridade temporal (Historical background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do Brasil que são baseados na CST.</description><subject>Complementaridade</subject><subject>CST</subject><subject>Descrição linguística</subject><subject>LANGUAGE & LINGUISTICS</subject><subject>LINGUISTICS</subject><subject>Processamento Automático de Língua Natural</subject><subject>Sumarização Multidocumento</subject><issn>1981-5794</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2018</creationdate><recordtype>article</recordtype><sourceid>DOA</sourceid><recordid>eNpFkM9OhDAQhzlo4rp698gLsLalBeqtAioJ2A1_Ll6a0hZls4oBPXg0Hjz5VLyYXddoMslkfpn5Mvkc5wyCFSQUnEMaQY-EFHswAtgLDpzFX3TkHE_TBgAYUYgWzkPMShbXaZndsflz_uBuwtyYF-s8LdLbmpVZwpLUrdNizUuWX7hVc1nNX0nGK3dtT-1csP9j1tS8mN_rLGZu0eR1lvC42YH4iXPYye1kTn_70mmu0jq-8XJ-bbdzT0McBl5IjZRY4y6AyFDd-UApiYgivgmkIqqlGnShAqFWFLRti6WOgq4FnUHayAD5Syfbc_UgN-J57B_l-CYG2YufYBjvhRxferU1wkCADYralloOwSBCBClAOqw76RtILWu1Z02qN9tBbIbX8ck-L6qdTrHTiaxIYG3aQsT_BqxSbts</recordid><startdate>20180301</startdate><enddate>20180301</enddate><creator>SOUZA, Jackson Wilke da Cruz</creator><creator>FELIPPO, Ariani Di</creator><general>Universidade Estadual Paulista Júlio de Mesquita Filho</general><scope>GPN</scope><scope>DOA</scope></search><sort><creationdate>20180301</creationdate><title>CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO</title><author>SOUZA, Jackson Wilke da Cruz ; FELIPPO, Ariani Di</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-LOGICAL-d1476-79eaa4d4f612e9df30cca25c53e6ac5cb9d0f7c07dc90bbb4ad86fb0fe2dea623</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>eng ; por</language><creationdate>2018</creationdate><topic>Complementaridade</topic><topic>CST</topic><topic>Descrição linguística</topic><topic>LANGUAGE & LINGUISTICS</topic><topic>LINGUISTICS</topic><topic>Processamento Automático de Língua Natural</topic><topic>Sumarização Multidocumento</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>SOUZA, Jackson Wilke da Cruz</creatorcontrib><creatorcontrib>FELIPPO, Ariani Di</creatorcontrib><collection>SciELO</collection><collection>DOAJ Directory of Open Access Journals</collection><jtitle>Alfa</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>SOUZA, Jackson Wilke da Cruz</au><au>FELIPPO, Ariani Di</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO</atitle><jtitle>Alfa</jtitle><addtitle>Alfa, rev. linguíst. (São José Rio Preto)</addtitle><date>2018-03-01</date><risdate>2018</risdate><volume>62</volume><issue>1</issue><spage>125</spage><epage>150</epage><pages>125-150</pages><issn>1981-5794</issn><abstract>RESUMO A complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam a complementaridade temporal (Historical background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do Brasil que são baseados na CST.</abstract><pub>Universidade Estadual Paulista Júlio de Mesquita Filho</pub><doi>10.1590/1981-5794-1804-6</doi><tpages>26</tpages><oa>free_for_read</oa></addata></record> |
fulltext | fulltext |
identifier | ISSN: 1981-5794 |
ispartof | Alfa, 2018-03, Vol.62 (1), p.125-150 |
issn | 1981-5794 |
language | eng ; por |
recordid | cdi_scielo_journals_S1981_57942018000100125 |
source | DOAJ Directory of Open Access Journals; Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals; IngentaConnect Free/Open Access Journals |
subjects | Complementaridade CST Descrição linguística LANGUAGE & LINGUISTICS LINGUISTICS Processamento Automático de Língua Natural Sumarização Multidocumento |
title | CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-15T04%3A11%3A17IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-scielo_doaj_&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=CARACTERIZA%C3%87%C3%83O%20DA%20COMPLEMENTARIDADE%20TEMPORAL:%20SUBS%C3%8DDIOS%20PARA%20SUMARIZA%C3%87%C3%83O%20AUTOM%C3%81TICA%20MULTIDOCUMENTO&rft.jtitle=Alfa&rft.au=SOUZA,%20Jackson%20Wilke%20da%20Cruz&rft.date=2018-03-01&rft.volume=62&rft.issue=1&rft.spage=125&rft.epage=150&rft.pages=125-150&rft.issn=1981-5794&rft_id=info:doi/10.1590/1981-5794-1804-6&rft_dat=%3Cscielo_doaj_%3ES1981_57942018000100125%3C/scielo_doaj_%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_scielo_id=S1981_57942018000100125&rft_doaj_id=oai_doaj_org_article_e104e28bb9bb45408252c05f4dfa3e19&rfr_iscdi=true |