基于深度学习与多分类轮询机制的高质量"卡脖子"技术专利识别模型——以专利申请文件为研究主体

G350; [目的]解决传统单分类方法无法有效识别高质量"卡脖子"技术专利的问题.[方法]以申请文件为研究主体,组合LSTM、Word2Vec及BERT得到多分类轮询的高质量"卡脖子"专利识别模型LSTM-Seq-BERT,并以IPC号为一级分类标签、授权状态为二级分类标签构建与模型对应的多级标签体系.[结果]对高质量"卡脖子"技术专利的识别精准度提高至88.1%.[局限]仅使用粤港澳大湾区专利,存在数据不平衡情况.[结论]本文构建的二级分类标签和轮询机制的模型可以提高对高质量"卡脖子"技术专利的识别准确率,具有实...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:数据分析与知识发现 2023-08, Vol.7 (8), p.30-45
Hauptverfasser: 赵雪峰, 吴德林, 吴伟伟, 孙卓荦, 胡瑾瑾, 廉莹, 单佳宇
Format: Artikel
Sprache:chi
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:G350; [目的]解决传统单分类方法无法有效识别高质量"卡脖子"技术专利的问题.[方法]以申请文件为研究主体,组合LSTM、Word2Vec及BERT得到多分类轮询的高质量"卡脖子"专利识别模型LSTM-Seq-BERT,并以IPC号为一级分类标签、授权状态为二级分类标签构建与模型对应的多级标签体系.[结果]对高质量"卡脖子"技术专利的识别精准度提高至88.1%.[局限]仅使用粤港澳大湾区专利,存在数据不平衡情况.[结论]本文构建的二级分类标签和轮询机制的模型可以提高对高质量"卡脖子"技术专利的识别准确率,具有实际应用价值.
ISSN:2096-3467
DOI:10.11925/infotech.2096-3467.2022.0721