Possibilities of automatic text analysis in the task of determining the psychological characteristics of the author
Using a tool for automatic text analysis and machine learning methods developed at the Federal Research Center ‘Computer Science and Control’ of the Russian Academy of Sciences, the first results are obtained in the task of identifying text parameters specific to people with certain psychological ch...
Gespeichert in:
Veröffentlicht in: | Èksperimentalʹnaâ psihologiâ 2020-01, Vol.13 (1), p.149-158 |
---|---|
Hauptverfasser: | , , , , |
Format: | Artikel |
Sprache: | eng ; rus |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Using a tool for automatic text analysis and machine learning methods developed at the Federal Research Center ‘Computer Science and Control’ of the Russian Academy of Sciences, the first results are obtained in the task of identifying text parameters specific to people with certain psychological characteristics. The tool of corpus linguistic and statistical research, based on the use of relational-situational analysis, psycholinguistic indicators and dictionaries covering the vocabulary of emotional and rational assessment, allowed us to obtain values for 177 textual attributes of the essay written by 486 subjects. To obtain data on the severity of characterological and personality characteristics of the subjects, a number of psychological questionnaires were used. When processing the data, binary classification algorithms were used — the support vector method (SVM) and the Random Forest method. The results allow us to draw conclusions about the prospects of using some textual parameters in problems of population psychodiagnostics and the adequacy of the applied classification algorithms.
С помощью разработанного в ФИЦ ИУ РАН инструмента автоматического анализа текста и методов машинного обучения получены первые результаты в задаче выявления текстовых параметров, специфичных для людей с определенными психологическими особенностями. Инструмент корпусных лингвостатистических исследований, опирающийся на использование реляционно-ситуационного анализа, психолингвистических показателей и словарей, охватывающих лексику эмоциональной и рациональной оценки, позволили получить значения для 177 текстовых признаков эссе, написанных 486 испытуемыми. Для получения данных об уровне выраженности характерологических и личностных особенностей испытуемых применялся ряд психологических опросников. При обработке данных использовались алгоритмы бинарной классификации — методы опорных векторов (SVM) и «Случайный лес» (Random Forest). Полученные результаты позволяют сделать выводы о перспективности использования некоторых текстовых параметров в задачах популяционной психодиагностики и об адекватности примененных алгоритмов классификации. |
---|---|
ISSN: | 2072-7593 2311-7036 |
DOI: | 10.17759/exppsy.2020130111 |