Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto

Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus c...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	Texto livre 2022, Vol.15
Hauptverfasser:	Fonseca, Claudia Aparecida, Guelpeli, Marcus Vinícius Carvalho, Souza Netto, Rafael Santiago de
Format:	Artikel
Sprache:	por
Schlagworte:	LANGUAGE & LINGUISTICS
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

container_end_page
container_issue
container_start_page
container_title	Texto livre
container_volume	15
creator	Fonseca, Claudia Aparecida Guelpeli, Marcus Vinícius Carvalho Souza Netto, Rafael Santiago de
description	Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.
doi_str_mv	10.35699/1983-3652.2022.35445
format	Article
fullrecord	<record><control><sourceid>scielo</sourceid><recordid>TN_cdi_scielo_journals_S1983_36522022000100210</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><scielo_id>S1983_36522022000100210</scielo_id><sourcerecordid>S1983_36522022000100210</sourcerecordid><originalsourceid>FETCH-scielo_journals_S1983_365220220001002103</originalsourceid><addsrcrecordid>eNqVT0FKxEAQHMQFF90nLPQHNnYmm9WcRfGs3sMwaSVLko7TM-B3xIPoN-Zjziwie_XS3VVNFVVKrUssqnrXNJdlc11tql2tC41aJ3K7rU_U8o8-PbrP1Epkj4jllda1xqV6faDZkdDkTfyMHwwdC3QmTxLvgg_uADqGl_g9kWPw9OaDGcDymED8slNvDczGGWCYHVsSMWNyZDDB8xjffW-TMR2UfKEWz2YQWv3uc1Xc3T7d3G_E9jRwu-fgpvRoH3PsNsfOxXJoRF1i9W_BDx9JWwI</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</title><source>DOAJ Directory of Open Access Journals</source><source>Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals</source><creator>Fonseca, Claudia Aparecida ; Guelpeli, Marcus Vinícius Carvalho ; Souza Netto, Rafael Santiago de</creator><creatorcontrib>Fonseca, Claudia Aparecida ; Guelpeli, Marcus Vinícius Carvalho ; Souza Netto, Rafael Santiago de</creatorcontrib><description>Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.</description><identifier>ISSN: 1983-3652</identifier><identifier>EISSN: 1983-3652</identifier><identifier>DOI: 10.35699/1983-3652.2022.35445</identifier><language>por</language><publisher>Universidade Federal de Minas Gerais - UFMG</publisher><subject>LANGUAGE & LINGUISTICS</subject><ispartof>Texto livre, 2022, Vol.15</ispartof><rights>This work is licensed under a Creative Commons Attribution 4.0 International License.</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>230,314,776,780,860,881,27903,27904</link.rule.ids></links><search><creatorcontrib>Fonseca, Claudia Aparecida</creatorcontrib><creatorcontrib>Guelpeli, Marcus Vinícius Carvalho</creatorcontrib><creatorcontrib>Souza Netto, Rafael Santiago de</creatorcontrib><title>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</title><title>Texto livre</title><addtitle>Texto livre</addtitle><description>Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.</description><subject>LANGUAGE & LINGUISTICS</subject><issn>1983-3652</issn><issn>1983-3652</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2022</creationdate><recordtype>article</recordtype><recordid>eNqVT0FKxEAQHMQFF90nLPQHNnYmm9WcRfGs3sMwaSVLko7TM-B3xIPoN-Zjziwie_XS3VVNFVVKrUssqnrXNJdlc11tql2tC41aJ3K7rU_U8o8-PbrP1Epkj4jllda1xqV6faDZkdDkTfyMHwwdC3QmTxLvgg_uADqGl_g9kWPw9OaDGcDymED8slNvDczGGWCYHVsSMWNyZDDB8xjffW-TMR2UfKEWz2YQWv3uc1Xc3T7d3G_E9jRwu-fgpvRoH3PsNsfOxXJoRF1i9W_BDx9JWwI</recordid><startdate>202201</startdate><enddate>202201</enddate><creator>Fonseca, Claudia Aparecida</creator><creator>Guelpeli, Marcus Vinícius Carvalho</creator><creator>Souza Netto, Rafael Santiago de</creator><general>Universidade Federal de Minas Gerais - UFMG</general><scope>GPN</scope></search><sort><creationdate>202201</creationdate><title>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</title><author>Fonseca, Claudia Aparecida ; Guelpeli, Marcus Vinícius Carvalho ; Souza Netto, Rafael Santiago de</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-scielo_journals_S1983_365220220001002103</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>por</language><creationdate>2022</creationdate><topic>LANGUAGE & LINGUISTICS</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Fonseca, Claudia Aparecida</creatorcontrib><creatorcontrib>Guelpeli, Marcus Vinícius Carvalho</creatorcontrib><creatorcontrib>Souza Netto, Rafael Santiago de</creatorcontrib><collection>SciELO</collection><jtitle>Texto livre</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Fonseca, Claudia Aparecida</au><au>Guelpeli, Marcus Vinícius Carvalho</au><au>Souza Netto, Rafael Santiago de</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto</atitle><jtitle>Texto livre</jtitle><addtitle>Texto livre</addtitle><date>2022-01</date><risdate>2022</risdate><volume>15</volume><issn>1983-3652</issn><eissn>1983-3652</eissn><abstract>Resumo O presente trabalho foi desenvolvido na área de Processamento de Linguagem Natural (PLN) e Estudos Linguísticos baseados em corpus compilado por ferramentas computacionais. Este trabalho parte do princípio de que é necessário assinalar uma estreita relação entre anotação e geração de corpus com a análise dos elementos constitutivos do gênero do texto-base. A proposta visa demonstrar, por via específica do estudo dos dados estruturados do gênero textual artigo científico, uma opção de técnica de processamento automático de texto. Para alcançar os objetivos propostos, criou-se um modelo computacional necessário para a compilação de um corpus linguístico, especializado, representativo do gênero Artigo Científico CorpACE. O projeto teve como objeto de estudo os elementos constitutivos do gênero textual artigo científico, marcados em XML, extraídos e coletados do banco de dados da SciELO-Scientific Electronic Library On-line. Como produto final, obteve-se uma base de dados com as informações extraídas e estruturadas no formato XML, que delimitam e identificam as marcações do gênero em análise, disponível para várias ferramentas e aplicações. Os resultados demonstram como a representação dos elementos constitutivos do gênero pode condensar as informações disponíveis de forma hierarquizada e dinâmica, construídas durante a compilação. Ao final da pesquisa, presume-se que se fazem necessárias mais pesquisas que aproximem a Ciência da Linguagem da Ciência da Computação com ênfase em PLN na tentativa de representar e manipular os conhecimentos linguísticos em seus vários níveis morfológico, sintático, semântico e discursivo, para a melhoria na implementação e manipulação do processamento automático do texto.</abstract><pub>Universidade Federal de Minas Gerais - UFMG</pub><doi>10.35699/1983-3652.2022.35445</doi><oa>free_for_read</oa></addata></record>
fulltext	fulltext
identifier	ISSN: 1983-3652
ispartof	Texto livre, 2022, Vol.15
issn	1983-3652 1983-3652
language	por
recordid	cdi_scielo_journals_S1983_36522022000100210
source	DOAJ Directory of Open Access Journals; Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals
subjects	LANGUAGE & LINGUISTICS
title	Representação dos dados estruturados do gênero textual como técnica para o processamento automático de texto
url	https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T03%3A19%3A02IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-scielo&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Representa%C3%A7%C3%A3o%20dos%20dados%20estruturados%20do%20g%C3%AAnero%20textual%20como%20t%C3%A9cnica%20para%20o%20processamento%20autom%C3%A1tico%20de%20texto&rft.jtitle=Texto%20livre&rft.au=Fonseca,%20Claudia%20Aparecida&rft.date=2022-01&rft.volume=15&rft.issn=1983-3652&rft.eissn=1983-3652&rft_id=info:doi/10.35699/1983-3652.2022.35445&rft_dat=%3Cscielo%3ES1983_36522022000100210%3C/scielo%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rft_scielo_id=S1983_36522022000100210&rfr_iscdi=true