基于深度学习与多分类轮询机制的高质量"卡脖子"技术专利识别模型——以专利申请文件为研究主体
G350; [目的]解决传统单分类方法无法有效识别高质量"卡脖子"技术专利的问题.[方法]以申请文件为研究主体,组合LSTM、Word2Vec及BERT得到多分类轮询的高质量"卡脖子"专利识别模型LSTM-Seq-BERT,并以IPC号为一级分类标签、授权状态为二级分类标签构建与模型对应的多级标签体系.[结果]对高质量"卡脖子"技术专利的识别精准度提高至88.1%.[局限]仅使用粤港澳大湾区专利,存在数据不平衡情况.[结论]本文构建的二级分类标签和轮询机制的模型可以提高对高质量"卡脖子"技术专利的识别准确率,具有实...
Gespeichert in:
Veröffentlicht in: | 数据分析与知识发现 2023-08, Vol.7 (8), p.30-45 |
---|---|
Hauptverfasser: | , , , , , , |
Format: | Artikel |
Sprache: | chi |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | G350; [目的]解决传统单分类方法无法有效识别高质量"卡脖子"技术专利的问题.[方法]以申请文件为研究主体,组合LSTM、Word2Vec及BERT得到多分类轮询的高质量"卡脖子"专利识别模型LSTM-Seq-BERT,并以IPC号为一级分类标签、授权状态为二级分类标签构建与模型对应的多级标签体系.[结果]对高质量"卡脖子"技术专利的识别精准度提高至88.1%.[局限]仅使用粤港澳大湾区专利,存在数据不平衡情况.[结论]本文构建的二级分类标签和轮询机制的模型可以提高对高质量"卡脖子"技术专利的识别准确率,具有实际应用价值. |
---|---|
ISSN: | 2096-3467 |
DOI: | 10.11925/infotech.2096-3467.2022.0721 |