Автоматизация морфологической разметки архивных документов (Preprint)

Работа посвящена описанию созданной авторами статьи надстройке над утилитой для стемминга MyStem И. Сегаловича. Приложение добавляет к возможностям утилиты удобный графический интерфейс, простой для освоения и интуитивно понятный пользователям, не специализирующимся в информационных технологиях. Оно...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Mathematical Physics and Computer Modeling 2019-08, Vol.22 No (4)
Hauptverfasser: Комендантов, Анатолий Сергеевич, Матвеев, Александр Георгиевич, Светлов, Андрей Владимирович
Format: Artikel
Sprache:eng
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Работа посвящена описанию созданной авторами статьи надстройке над утилитой для стемминга MyStem И. Сегаловича. Приложение добавляет к возможностям утилиты удобный графический интерфейс, простой для освоения и интуитивно понятный пользователям, не специализирующимся в информационных технологиях. Оно перехватывает вывод утилиты MyStem, специальным образом переформатирует и анализирует его. Кроме того, приложение имеет функционал для снятии омонии вручную, если автоматическими средствами морфологические характеристики слова определены неверно. Основное назначение данного приложения — подготовка морфологической разметки документов архивного фонда «Михайловский станичный атаман» для создания лингвистического корпуса. В ходе работы над приложением была решена задача корректной обработки текстов, содержащих устаревшие кириллические символы.
ISSN:2587-6325
2587-6902
DOI:10.15688/mpcm.jvolsu.2019.4.4