Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto

Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus c...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Texto livre 2022, Vol.15
Hauptverfasser: Fonseca, Claudia Aparecida, Guelpeli, Marcus Vinícius Carvalho, Souza Netto, Rafael Santiago de
Format: Artikel
Sprache:por
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title Texto livre
container_volume 15
creator Fonseca, Claudia Aparecida
Guelpeli, Marcus Vinícius Carvalho
Souza Netto, Rafael Santiago de
description Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.
doi_str_mv 10.35699/1983-3652.2022.35445
format Article
fullrecord <record><control><sourceid>scielo</sourceid><recordid>TN_cdi_scielo_journals_S1983_36522022000100210</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><scielo_id>S1983_36522022000100210</scielo_id><sourcerecordid>S1983_36522022000100210</sourcerecordid><originalsourceid>FETCH-scielo_journals_S1983_365220220001002103</originalsourceid><addsrcrecordid>eNqVT0FKxEAQHMQFF90nLPQHNnYmm9WcRfGs3sMwaSVLko7TM-B3xIPoN-Zjziwie_XS3VVNFVVKrUssqnrXNJdlc11tql2tC41aJ3K7rU_U8o8-PbrP1Epkj4jllda1xqV6faDZkdDkTfyMHwwdC3QmTxLvgg_uADqGl_g9kWPw9OaDGcDymED8slNvDczGGWCYHVsSMWNyZDDB8xjffW-TMR2UfKEWz2YQWv3uc1Xc3T7d3G_E9jRwu-fgpvRoH3PsNsfOxXJoRF1i9W_BDx9JWwI</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</title><source>DOAJ Directory of Open Access Journals</source><source>Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals</source><creator>Fonseca, Claudia Aparecida ; Guelpeli, Marcus Vinícius Carvalho ; Souza Netto, Rafael Santiago de</creator><creatorcontrib>Fonseca, Claudia Aparecida ; Guelpeli, Marcus Vinícius Carvalho ; Souza Netto, Rafael Santiago de</creatorcontrib><description>Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.</description><identifier>ISSN: 1983-3652</identifier><identifier>EISSN: 1983-3652</identifier><identifier>DOI: 10.35699/1983-3652.2022.35445</identifier><language>por</language><publisher>Universidade Federal de Minas Gerais - UFMG</publisher><subject>LANGUAGE &amp; LINGUISTICS</subject><ispartof>Texto livre, 2022, Vol.15</ispartof><rights>This work is licensed under a Creative Commons Attribution 4.0 International License.</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>230,314,776,780,860,881,27903,27904</link.rule.ids></links><search><creatorcontrib>Fonseca, Claudia Aparecida</creatorcontrib><creatorcontrib>Guelpeli, Marcus Vinícius Carvalho</creatorcontrib><creatorcontrib>Souza Netto, Rafael Santiago de</creatorcontrib><title>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</title><title>Texto livre</title><addtitle>Texto livre</addtitle><description>Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.</description><subject>LANGUAGE &amp; LINGUISTICS</subject><issn>1983-3652</issn><issn>1983-3652</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2022</creationdate><recordtype>article</recordtype><recordid>eNqVT0FKxEAQHMQFF90nLPQHNnYmm9WcRfGs3sMwaSVLko7TM-B3xIPoN-Zjziwie_XS3VVNFVVKrUssqnrXNJdlc11tql2tC41aJ3K7rU_U8o8-PbrP1Epkj4jllda1xqV6faDZkdDkTfyMHwwdC3QmTxLvgg_uADqGl_g9kWPw9OaDGcDymED8slNvDczGGWCYHVsSMWNyZDDB8xjffW-TMR2UfKEWz2YQWv3uc1Xc3T7d3G_E9jRwu-fgpvRoH3PsNsfOxXJoRF1i9W_BDx9JWwI</recordid><startdate>202201</startdate><enddate>202201</enddate><creator>Fonseca, Claudia Aparecida</creator><creator>Guelpeli, Marcus Vinícius Carvalho</creator><creator>Souza Netto, Rafael Santiago de</creator><general>Universidade Federal de Minas Gerais - UFMG</general><scope>GPN</scope></search><sort><creationdate>202201</creationdate><title>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</title><author>Fonseca, Claudia Aparecida ; Guelpeli, Marcus Vinícius Carvalho ; Souza Netto, Rafael Santiago de</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-scielo_journals_S1983_365220220001002103</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>por</language><creationdate>2022</creationdate><topic>LANGUAGE &amp; LINGUISTICS</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Fonseca, Claudia Aparecida</creatorcontrib><creatorcontrib>Guelpeli, Marcus Vinícius Carvalho</creatorcontrib><creatorcontrib>Souza Netto, Rafael Santiago de</creatorcontrib><collection>SciELO</collection><jtitle>Texto livre</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Fonseca, Claudia Aparecida</au><au>Guelpeli, Marcus Vinícius Carvalho</au><au>Souza Netto, Rafael Santiago de</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</atitle><jtitle>Texto livre</jtitle><addtitle>Texto livre</addtitle><date>2022-01</date><risdate>2022</risdate><volume>15</volume><issn>1983-3652</issn><eissn>1983-3652</eissn><abstract>Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.</abstract><pub>Universidade Federal de Minas Gerais - UFMG</pub><doi>10.35699/1983-3652.2022.35445</doi><oa>free_for_read</oa></addata></record>
fulltext fulltext
identifier ISSN: 1983-3652
ispartof Texto livre, 2022, Vol.15
issn 1983-3652
1983-3652
language por
recordid cdi_scielo_journals_S1983_36522022000100210
source DOAJ Directory of Open Access Journals; Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals
subjects LANGUAGE & LINGUISTICS
title Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T03%3A19%3A02IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-scielo&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Representa%C3%A7%C3%A3o%20dos%20dados%20estruturados%20do%20g%C3%AAnero%20textual%20como%20t%C3%A9cnica%20para%20o%20processamento%20autom%C3%A1tico%20de%20texto&rft.jtitle=Texto%20livre&rft.au=Fonseca,%20Claudia%20Aparecida&rft.date=2022-01&rft.volume=15&rft.issn=1983-3652&rft.eissn=1983-3652&rft_id=info:doi/10.35699/1983-3652.2022.35445&rft_dat=%3Cscielo%3ES1983_36522022000100210%3C/scielo%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_scielo_id=S1983_36522022000100210&rfr_iscdi=true