文体の個人差と個人内恒常性の検証: 階層ベイズモデルによる学術論文の比較
「1. はじめに」「1.1. 文体的計量分析による著者識別」日本の計量国語学関連分野においては, 1950年代ころから, 文学作品や宗教に関する書物, または作文などを題材として, 文体を基にした著者識別研究が行なわれてきた (安本, 1958, 1959 ; 村上・伊藤, 1991 : 金, 2014). たとえば, 安本 (1958) は, 『源氏物語』の, 名詞や助詞の使用頻度, 文の長さといった特徴を分析し, 「宇治十帖」の作者が紫式部である可能性が低いと述べている. また, 鎌倉時代の仏教者日蓮の作とされていた5編の真贋判定を行った村上・伊藤 (1991) は, 単語や品詞の使用率,...
Gespeichert in:
Veröffentlicht in: | 行動計量学 2019, Vol.46(2), pp.87-95 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | jpn |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 「1. はじめに」「1.1. 文体的計量分析による著者識別」日本の計量国語学関連分野においては, 1950年代ころから, 文学作品や宗教に関する書物, または作文などを題材として, 文体を基にした著者識別研究が行なわれてきた (安本, 1958, 1959 ; 村上・伊藤, 1991 : 金, 2014). たとえば, 安本 (1958) は, 『源氏物語』の, 名詞や助詞の使用頻度, 文の長さといった特徴を分析し, 「宇治十帖」の作者が紫式部である可能性が低いと述べている. また, 鎌倉時代の仏教者日蓮の作とされていた5編の真贋判定を行った村上・伊藤 (1991) は, 単語や品詞の使用率, 文の長さといった特徴に関して階層的クラスター分析や主成分分析を行い, 『三大秘法稟承事』ならびに『日女御前御返事』が日蓮によって執筆された可能性が高いと結論付けている. 最近では, 従来の多変量データ解析だけではなく, ランダムフォレストやサポートベクターマシンなどの分類器を用いた機械学習による著者識別研究が増加傾向にある. |
---|---|
ISSN: | 0385-5481 1880-4705 |
DOI: | 10.2333/jbhmk.46.87 |