El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas
This paper demonstrates that a computer can determine the authorship of a text. To this end we created a corpus of 122 contemporary novels written in Spanish (69 historical novels, 50 crime novels, and 3 westerns). The corpus was then studied using stylo, a stylometric analysis package written in th...
Gespeichert in:
Veröffentlicht in: | Caracteres (Salamanca) 2016, Vol.5 (2), p.196-245 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | spa |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | 245 |
---|---|
container_issue | 2 |
container_start_page | 196 |
container_title | Caracteres (Salamanca) |
container_volume | 5 |
creator | Fradejas Rueda, José Manuel |
description | This paper demonstrates that a computer can determine the authorship of a text.
To this end we created a corpus of 122 contemporary novels written in Spanish
(69 historical novels, 50 crime novels, and 3 westerns). The corpus was then
studied using stylo, a stylometric analysis package written in the programming
language R. We chose to apply the simplest of the multiple types of analysis
offered by this package: cluster analysis. The results are very interesting: by
taking into account just the 100 most frequently used words (MFW), the
computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without
incurring in any errors.
En este artículo se trata de mostrar si un ordenador es capaz de determinar la
autoría de un texto. Para ello se ha creado un corpus de 122 novelas
contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han
analizado con el paquete de análisis estilométrico stylo. De todos los análisis
que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis
de grupos. Los resultados han sido muy interesantes ya que con un mínimo de
100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin
error alguno, las distintas obras de cada autor y ha sabido asignar al autor real
aquellas que se publicaron bajo seudónimo. |
format | Article |
fullrecord | <record><control><sourceid>dialnet</sourceid><recordid>TN_cdi_dialnet_primary_oai_dialnet_unirioja_es_ART0001253430</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>oai_dialnet_unirioja_es_ART0001253430</sourcerecordid><originalsourceid>FETCH-dialnet_primary_oai_dialnet_unirioja_es_ART00012534303</originalsourceid><addsrcrecordid>eNqljkEKwjAQRYMoWNQ75AJCbNOK4kak4lrch6GNOCU2JRMFj-PSpXiEXsyICu6Fgf-Y-f8zHRbFcSrHUs6y7g_32YioEkJM4jSbChmxMjcc6vZqkJC4Jo_GHtubd1hYDo3BAsoA3IRBrx34k4Pga6C9WwPzcCBe27N-aWODH6EIqPkBybeP0AM0ZL09GNKjjw7YYp3vVptxiWBq7VXj8Ajuoiyg-u5ONTq0FShNarndvZ9OZCKSP-NP701euQ</addsrcrecordid><sourcetype>Open Website</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</title><source>Dialnet</source><source>DOAJ Directory of Open Access Journals</source><source>EZB-FREE-00999 freely available EZB journals</source><creator>Fradejas Rueda, José Manuel</creator><creatorcontrib>Fradejas Rueda, José Manuel</creatorcontrib><description>This paper demonstrates that a computer can determine the authorship of a text.
To this end we created a corpus of 122 contemporary novels written in Spanish
(69 historical novels, 50 crime novels, and 3 westerns). The corpus was then
studied using stylo, a stylometric analysis package written in the programming
language R. We chose to apply the simplest of the multiple types of analysis
offered by this package: cluster analysis. The results are very interesting: by
taking into account just the 100 most frequently used words (MFW), the
computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without
incurring in any errors.
En este artículo se trata de mostrar si un ordenador es capaz de determinar la
autoría de un texto. Para ello se ha creado un corpus de 122 novelas
contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han
analizado con el paquete de análisis estilométrico stylo. De todos los análisis
que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis
de grupos. Los resultados han sido muy interesantes ya que con un mínimo de
100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin
error alguno, las distintas obras de cada autor y ha sabido asignar al autor real
aquellas que se publicaron bajo seudónimo.</description><identifier>ISSN: 2254-4496</identifier><identifier>EISSN: 2254-4496</identifier><language>spa</language><subject>atribución de autoría ; authorship attribution ; crime fiction ; Estilometría ; historical fiction ; novela histórica ; novela policiaca ; Stylometry</subject><ispartof>Caracteres (Salamanca), 2016, Vol.5 (2), p.196-245</ispartof><rights>LICENCIA DE USO: Los documentos a texto completo incluidos en Dialnet son de acceso libre y propiedad de sus autores y/o editores. Por tanto, cualquier acto de reproducción, distribución, comunicación pública y/o transformación total o parcial requiere el consentimiento expreso y escrito de aquéllos. Cualquier enlace al texto completo de estos documentos deberá hacerse a través de la URL oficial de éstos en Dialnet. Más información: https://dialnet.unirioja.es/info/derechosOAI | INTELLECTUAL PROPERTY RIGHTS STATEMENT: Full text documents hosted by Dialnet are protected by copyright and/or related rights. This digital object is accessible without charge, but its use is subject to the licensing conditions set by its authors or editors. Unless expressly stated otherwise in the licensing conditions, you are free to linking, browsing, printing and making a copy for your own personal purposes. All other acts of reproduction and communication to the public are subject to the licensing conditions expressed by editors and authors and require consent from them. Any link to this document should be made using its official URL in Dialnet. More info: https://dialnet.unirioja.es/info/derechosOAI</rights><lds50>peer_reviewed</lds50><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,776,780,870,4009</link.rule.ids></links><search><creatorcontrib>Fradejas Rueda, José Manuel</creatorcontrib><title>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</title><title>Caracteres (Salamanca)</title><description>This paper demonstrates that a computer can determine the authorship of a text.
To this end we created a corpus of 122 contemporary novels written in Spanish
(69 historical novels, 50 crime novels, and 3 westerns). The corpus was then
studied using stylo, a stylometric analysis package written in the programming
language R. We chose to apply the simplest of the multiple types of analysis
offered by this package: cluster analysis. The results are very interesting: by
taking into account just the 100 most frequently used words (MFW), the
computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without
incurring in any errors.
En este artículo se trata de mostrar si un ordenador es capaz de determinar la
autoría de un texto. Para ello se ha creado un corpus de 122 novelas
contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han
analizado con el paquete de análisis estilométrico stylo. De todos los análisis
que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis
de grupos. Los resultados han sido muy interesantes ya que con un mínimo de
100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin
error alguno, las distintas obras de cada autor y ha sabido asignar al autor real
aquellas que se publicaron bajo seudónimo.</description><subject>atribución de autoría</subject><subject>authorship attribution</subject><subject>crime fiction</subject><subject>Estilometría</subject><subject>historical fiction</subject><subject>novela histórica</subject><subject>novela policiaca</subject><subject>Stylometry</subject><issn>2254-4496</issn><issn>2254-4496</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2016</creationdate><recordtype>article</recordtype><sourceid>FKZ</sourceid><recordid>eNqljkEKwjAQRYMoWNQ75AJCbNOK4kak4lrch6GNOCU2JRMFj-PSpXiEXsyICu6Fgf-Y-f8zHRbFcSrHUs6y7g_32YioEkJM4jSbChmxMjcc6vZqkJC4Jo_GHtubd1hYDo3BAsoA3IRBrx34k4Pga6C9WwPzcCBe27N-aWODH6EIqPkBybeP0AM0ZL09GNKjjw7YYp3vVptxiWBq7VXj8Ajuoiyg-u5ONTq0FShNarndvZ9OZCKSP-NP701euQ</recordid><startdate>2016</startdate><enddate>2016</enddate><creator>Fradejas Rueda, José Manuel</creator><scope>AGMXS</scope><scope>FKZ</scope></search><sort><creationdate>2016</creationdate><title>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</title><author>Fradejas Rueda, José Manuel</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-dialnet_primary_oai_dialnet_unirioja_es_ART00012534303</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>spa</language><creationdate>2016</creationdate><topic>atribución de autoría</topic><topic>authorship attribution</topic><topic>crime fiction</topic><topic>Estilometría</topic><topic>historical fiction</topic><topic>novela histórica</topic><topic>novela policiaca</topic><topic>Stylometry</topic><toplevel>peer_reviewed</toplevel><toplevel>online_resources</toplevel><creatorcontrib>Fradejas Rueda, José Manuel</creatorcontrib><collection>Dialnet (Open Access Full Text)</collection><collection>Dialnet</collection><jtitle>Caracteres (Salamanca)</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Fradejas Rueda, José Manuel</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas</atitle><jtitle>Caracteres (Salamanca)</jtitle><date>2016</date><risdate>2016</risdate><volume>5</volume><issue>2</issue><spage>196</spage><epage>245</epage><pages>196-245</pages><issn>2254-4496</issn><eissn>2254-4496</eissn><abstract>This paper demonstrates that a computer can determine the authorship of a text.
To this end we created a corpus of 122 contemporary novels written in Spanish
(69 historical novels, 50 crime novels, and 3 westerns). The corpus was then
studied using stylo, a stylometric analysis package written in the programming
language R. We chose to apply the simplest of the multiple types of analysis
offered by this package: cluster analysis. The results are very interesting: by
taking into account just the 100 most frequently used words (MFW), the
computer was able to group the different works of each author as well as assigning those published under a pseudonym to the true author without
incurring in any errors.
En este artículo se trata de mostrar si un ordenador es capaz de determinar la
autoría de un texto. Para ello se ha creado un corpus de 122 novelas
contemporáneas (69 de tema histórico, 50 policiacas y 3 del oeste) y se han
analizado con el paquete de análisis estilométrico stylo. De todos los análisis
que ofrece este paquete, escrito en R, se ha utilizado el más sencillo: el análisis
de grupos. Los resultados han sido muy interesantes ya que con un mínimo de
100 palabras (las más frecuentes) el ordenador ha sido capaz de agrupar, sin
error alguno, las distintas obras de cada autor y ha sabido asignar al autor real
aquellas que se publicaron bajo seudónimo.</abstract><oa>free_for_read</oa></addata></record> |
fulltext | fulltext |
identifier | ISSN: 2254-4496 |
ispartof | Caracteres (Salamanca), 2016, Vol.5 (2), p.196-245 |
issn | 2254-4496 2254-4496 |
language | spa |
recordid | cdi_dialnet_primary_oai_dialnet_unirioja_es_ART0001253430 |
source | Dialnet; DOAJ Directory of Open Access Journals; EZB-FREE-00999 freely available EZB journals |
subjects | atribución de autoría authorship attribution crime fiction Estilometría historical fiction novela histórica novela policiaca Stylometry |
title | El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-27T09%3A38%3A14IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-dialnet&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=El%20an%C3%A1lisis%20estilom%C3%A9trico%20aplicado%20a%20la%20literatura%20espa%C3%B1ola:%20las%20novelas%20policiacas%20e%20hist%C3%B3ricas&rft.jtitle=Caracteres%20(Salamanca)&rft.au=Fradejas%20Rueda,%20Jos%C3%A9%20Manuel&rft.date=2016&rft.volume=5&rft.issue=2&rft.spage=196&rft.epage=245&rft.pages=196-245&rft.issn=2254-4496&rft.eissn=2254-4496&rft_id=info:doi/&rft_dat=%3Cdialnet%3Eoai_dialnet_unirioja_es_ART0001253430%3C/dialnet%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true |