基于PAT Tree的半结构化文本信息抽取范式研究

TP3; 信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现.以前是利用使用者的使用模式或记录,找出相关的抽取规则.而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则.

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:情报杂志 2007, Vol.26 (7), p.55-58
1. Verfasser: 曹进军
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP3; 信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现.以前是利用使用者的使用模式或记录,找出相关的抽取规则.而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则.
ISSN:1002-1965
DOI:10.3969/j.issn.1002-1965.2007.07.017