基于GATE的楚辞语义标注研究
由于适用性、性能等方面的问题,现有古汉语识别算法无法满足半自动构建楚辞语料库的要求。本文结合程序处理与传统文献研究方法,制作具有语义特征的楚辞词表。利用开源平台设计满足楚辞行文语法的规则,准确标注楚辞文档。通过选取不同题材的楚辞进行测试,调整词表、规则的适用性,提高计算机在楚辞语料库建设中的参与度,同时也提出一种先秦文献处理的新思路。...
Gespeichert in:
Veröffentlicht in: | 图书馆理论与实践 2015 (11), p.58-62 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | chi |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | 由于适用性、性能等方面的问题,现有古汉语识别算法无法满足半自动构建楚辞语料库的要求。本文结合程序处理与传统文献研究方法,制作具有语义特征的楚辞词表。利用开源平台设计满足楚辞行文语法的规则,准确标注楚辞文档。通过选取不同题材的楚辞进行测试,调整词表、规则的适用性,提高计算机在楚辞语料库建设中的参与度,同时也提出一种先秦文献处理的新思路。 |
---|---|
ISSN: | 1005-8214 |