El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas

This paper demonstrates that a computer can determine the authorship of a text. To this end we created a corpus of 122 contemporary novels written in Spanish (69 historical novels, 50 crime novels, and 3 westerns). The corpus was then studied using stylo, a stylometric analysis package written in th...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Caracteres (Salamanca) 2016, Vol.5 (2), p.196-245
1. Verfasser: Fradejas Rueda, José Manuel
Format: Artikel
Sprache:spa
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 245
container_issue 2
container_start_page 196
container_title Caracteres (Salamanca)
container_volume 5
creator Fradejas Rueda, José Manuel
description This paper demonstrates that a computer can determine the authorship of a text. To this end we created a corpus of 122 contemporary novels written in Spanish (69 historical novels, 50 crime novels, and 3 westerns). The corpus was then studied using stylo, a stylometric analysis package written in the programming language R. We chose to apply the simplest of the multiple types of analysis offered by this package: cluster analysis. The results are very interesting: by taking into account just the 100 most frequently used words (MFW), the computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without incurring in any errors. En este artículo se trata de mostrar si un ordenador es capaz de determinar la autoría de un texto. Para ello se ha creado un corpus de 122 novelas contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han analizado con el paquete de análisis estilométrico stylo. De todos los análisis que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis de grupos. Los resultados han sido muy interesantes ya que con un mínimo de 100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin error alguno, las distintas obras de cada autor y ha sabido asignar al autor real aquellas que se publicaron bajo seudónimo.
format Article
fullrecord <record><control><sourceid>dialnet</sourceid><recordid>TN_cdi_dialnet_primary_oai_dialnet_unirioja_es_ART0001253430</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>oai_dialnet_unirioja_es_ART0001253430</sourcerecordid><originalsourceid>FETCH-dialnet_primary_oai_dialnet_unirioja_es_ART00012534303</originalsourceid><addsrcrecordid>eNqljkEKwjAQRYMoWNQ75AJCbNOK4kak4lrch6GNOCU2JRMFj-PSpXiEXsyICu6Fgf-Y-f8zHRbFcSrHUs6y7g_32YioEkJM4jSbChmxMjcc6vZqkJC4Jo_GHtubd1hYDo3BAsoA3IRBrx34k4Pga6C9WwPzcCBe27N-aWODH6EIqPkBybeP0AM0ZL09GNKjjw7YYp3vVptxiWBq7VXj8Ajuoiyg-u5ONTq0FShNarndvZ9OZCKSP-NP701euQ</addsrcrecordid><sourcetype>Open Website</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</title><source>Dialnet</source><source>DOAJ Directory of Open Access Journals</source><source>EZB-FREE-00999 freely available EZB journals</source><creator>Fradejas Rueda, José Manuel</creator><creatorcontrib>Fradejas Rueda, José Manuel</creatorcontrib><description>This paper demonstrates that a computer can determine the authorship of a text. To this end we created a corpus of 122 contemporary novels written in Spanish (69 historical novels, 50 crime novels, and 3 westerns). The corpus was then studied using stylo, a stylometric analysis package written in the programming language R. We chose to apply the simplest of the multiple types of analysis offered by this package: cluster analysis. The results are very interesting: by taking into account just the 100 most frequently used words (MFW), the computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without incurring in any errors. En este artículo se trata de mostrar si un ordenador es capaz de determinar la autoría de un texto. Para ello se ha creado un corpus de 122 novelas contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han analizado con el paquete de análisis estilométrico stylo. De todos los análisis que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis de grupos. Los resultados han sido muy interesantes ya que con un mínimo de 100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin error alguno, las distintas obras de cada autor y ha sabido asignar al autor real aquellas que se publicaron bajo seudónimo.</description><identifier>ISSN: 2254-4496</identifier><identifier>EISSN: 2254-4496</identifier><language>spa</language><subject>atribución de autoría ; authorship attribution ; crime fiction ; Estilometría ; historical fiction ; novela histórica ; novela policiaca ; Stylometry</subject><ispartof>Caracteres (Salamanca), 2016, Vol.5 (2), p.196-245</ispartof><rights>LICENCIA DE USO: Los documentos a texto completo incluidos en Dialnet son de acceso libre y propiedad de sus autores y/o editores. Por tanto, cualquier acto de reproducción, distribución, comunicación pública y/o transformación total o parcial requiere el consentimiento expreso y escrito de aquéllos. Cualquier enlace al texto completo de estos documentos deberá hacerse a través de la URL oficial de éstos en Dialnet. Más información: https://dialnet.unirioja.es/info/derechosOAI | INTELLECTUAL PROPERTY RIGHTS STATEMENT: Full text documents hosted by Dialnet are protected by copyright and/or related rights. This digital object is accessible without charge, but its use is subject to the licensing conditions set by its authors or editors. Unless expressly stated otherwise in the licensing conditions, you are free to linking, browsing, printing and making a copy for your own personal purposes. All other acts of reproduction and communication to the public are subject to the licensing conditions expressed by editors and authors and require consent from them. Any link to this document should be made using its official URL in Dialnet. More info: https://dialnet.unirioja.es/info/derechosOAI</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,776,780,870,4009</link.rule.ids></links><search><creatorcontrib>Fradejas Rueda, José Manuel</creatorcontrib><title>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</title><title>Caracteres (Salamanca)</title><description>This paper demonstrates that a computer can determine the authorship of a text. To this end we created a corpus of 122 contemporary novels written in Spanish (69 historical novels, 50 crime novels, and 3 westerns). The corpus was then studied using stylo, a stylometric analysis package written in the programming language R. We chose to apply the simplest of the multiple types of analysis offered by this package: cluster analysis. The results are very interesting: by taking into account just the 100 most frequently used words (MFW), the computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without incurring in any errors. En este artículo se trata de mostrar si un ordenador es capaz de determinar la autoría de un texto. Para ello se ha creado un corpus de 122 novelas contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han analizado con el paquete de análisis estilométrico stylo. De todos los análisis que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis de grupos. Los resultados han sido muy interesantes ya que con un mínimo de 100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin error alguno, las distintas obras de cada autor y ha sabido asignar al autor real aquellas que se publicaron bajo seudónimo.</description><subject>atribución de autoría</subject><subject>authorship attribution</subject><subject>crime fiction</subject><subject>Estilometría</subject><subject>historical fiction</subject><subject>novela histórica</subject><subject>novela policiaca</subject><subject>Stylometry</subject><issn>2254-4496</issn><issn>2254-4496</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2016</creationdate><recordtype>article</recordtype><sourceid>FKZ</sourceid><recordid>eNqljkEKwjAQRYMoWNQ75AJCbNOK4kak4lrch6GNOCU2JRMFj-PSpXiEXsyICu6Fgf-Y-f8zHRbFcSrHUs6y7g_32YioEkJM4jSbChmxMjcc6vZqkJC4Jo_GHtubd1hYDo3BAsoA3IRBrx34k4Pga6C9WwPzcCBe27N-aWODH6EIqPkBybeP0AM0ZL09GNKjjw7YYp3vVptxiWBq7VXj8Ajuoiyg-u5ONTq0FShNarndvZ9OZCKSP-NP701euQ</recordid><startdate>2016</startdate><enddate>2016</enddate><creator>Fradejas Rueda, José Manuel</creator><scope>AGMXS</scope><scope>FKZ</scope></search><sort><creationdate>2016</creationdate><title>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</title><author>Fradejas Rueda, José Manuel</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-dialnet_primary_oai_dialnet_unirioja_es_ART00012534303</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>spa</language><creationdate>2016</creationdate><topic>atribución de autoría</topic><topic>authorship attribution</topic><topic>crime fiction</topic><topic>Estilometría</topic><topic>historical fiction</topic><topic>novela histórica</topic><topic>novela policiaca</topic><topic>Stylometry</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Fradejas Rueda, José Manuel</creatorcontrib><collection>Dialnet (Open Access Full Text)</collection><collection>Dialnet</collection><jtitle>Caracteres (Salamanca)</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Fradejas Rueda, José Manuel</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</atitle><jtitle>Caracteres (Salamanca)</jtitle><date>2016</date><risdate>2016</risdate><volume>5</volume><issue>2</issue><spage>196</spage><epage>245</epage><pages>196-245</pages><issn>2254-4496</issn><eissn>2254-4496</eissn><abstract>This paper demonstrates that a computer can determine the authorship of a text. To this end we created a corpus of 122 contemporary novels written in Spanish (69 historical novels, 50 crime novels, and 3 westerns). The corpus was then studied using stylo, a stylometric analysis package written in the programming language R. We chose to apply the simplest of the multiple types of analysis offered by this package: cluster analysis. The results are very interesting: by taking into account just the 100 most frequently used words (MFW), the computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without incurring in any errors. En este artículo se trata de mostrar si un ordenador es capaz de determinar la autoría de un texto. Para ello se ha creado un corpus de 122 novelas contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han analizado con el paquete de análisis estilométrico stylo. De todos los análisis que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis de grupos. Los resultados han sido muy interesantes ya que con un mínimo de 100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin error alguno, las distintas obras de cada autor y ha sabido asignar al autor real aquellas que se publicaron bajo seudónimo.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext
identifier ISSN: 2254-4496
ispartof Caracteres (Salamanca), 2016, Vol.5 (2), p.196-245
issn 2254-4496
2254-4496
language spa
recordid cdi_dialnet_primary_oai_dialnet_unirioja_es_ART0001253430
source Dialnet; DOAJ Directory of Open Access Journals; EZB-FREE-00999 freely available EZB journals
subjects atribución de autoría
authorship attribution
crime fiction
Estilometría
historical fiction
novela histórica
novela policiaca
Stylometry
title El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-27T09%3A38%3A14IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-dialnet&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=El%20an%C3%A1lisis%20estilom%C3%A9trico%20aplicado%20a%20la%20literatura%20espa%C3%B1ola:%20las%20novelas%20policiacas%20e%20hist%C3%B3ricas&rft.jtitle=Caracteres%20(Salamanca)&rft.au=Fradejas%20Rueda,%20Jos%C3%A9%20Manuel&rft.date=2016&rft.volume=5&rft.issue=2&rft.spage=196&rft.epage=245&rft.pages=196-245&rft.issn=2254-4496&rft.eissn=2254-4496&rft_id=info:doi/&rft_dat=%3Cdialnet%3Eoai_dialnet_unirioja_es_ART0001253430%3C/dialnet%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true