基于聚簇隐马尔可夫模型的文本信息抽取

应用隐马尔可夫模型是文本信息抽取的一种重要方法。对于网上不同来源的文本，由于其格式很不相同，进行混合训练，一般难以得到较优化的模型。将聚簇应用到文本信息抽取中，首先通过一种改进的k-平均方法对训练文本的Markov链模型进行聚簇，然后训练各簇的隐马尔可夫模型，提出了一种基于聚簇隐马尔可夫模型的文本信息抽取算法（C-HMM）。对700篇网上不同来源的文本进行信息抽取仿真实验，结果表明，新的算法能有效地提高抽取性能。...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
Veröffentlicht in:	Xi tong fang zhen xue bao 2007, Vol.19 (21), p.4926-4931
1. Verfasser:	周顺先林亚平王耀南易叶青
Format:	Artikel
Sprache:	chi
Schlagworte:	信息抽取聚簇隐马尔可夫模型马尔可夫链
Online-Zugang:	Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	应用隐马尔可夫模型是文本信息抽取的一种重要方法。对于网上不同来源的文本，由于其格式很不相同，进行混合训练，一般难以得到较优化的模型。将聚簇应用到文本信息抽取中，首先通过一种改进的k-平均方法对训练文本的Markov链模型进行聚簇，然后训练各簇的隐马尔可夫模型，提出了一种基于聚簇隐马尔可夫模型的文本信息抽取算法（C-HMM）。对700篇网上不同来源的文本进行信息抽取仿真实验，结果表明，新的算法能有效地提高抽取性能。
ISSN:	1004-731X
DOI:	10.3969/j.issn.1004-731X.2007.21.020