基于PAT Tree的半结构化文本信息抽取范式研究
TP3; 信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现.以前是利用使用者的使用模式或记录,找出相关的抽取规则.而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则.
Gespeichert in:
Veröffentlicht in: | 情报杂志 2007, Vol.26 (7), p.55-58 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | TP3; 信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现.以前是利用使用者的使用模式或记录,找出相关的抽取规则.而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则. |
---|---|
ISSN: | 1002-1965 |
DOI: | 10.3969/j.issn.1002-1965.2007.07.017 |