AUTOMATIC EMBEDDING OF ADDITIONAL CONTENT TO ARTICLES

The present disclosure relates to systems, devices, and methods for identifying additional content for an article. The systems, devices, and methods may identify a domain for the articles and content and may use machine learning models to classify the articles and the content into categories using s...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SINGHAL, Aman, SRINIVASAN, Prithvishankar, DE BARROS, Marcelo Medeiros
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The present disclosure relates to systems, devices, and methods for identifying additional content for an article. The systems, devices, and methods may identify a domain for the articles and content and may use machine learning models to classify the articles and the content into categories using smart tags for the domain. The systems, devices, and methods may convert the articles and the content into document vectors using a pre-trained domain specific language model and generate a relevance score for the articles and the content using the document vectors. The systems, devices, and methods may generate a list of predicted matches that includes content that is similar to the article based on the relevance score. The systems, devices, and methods may filter the list of predicted matches based on a temporal proximity to generate a list of additional content for the article. La présente invention concerne des systèmes, des dispositifs et des procédés pour identifier un contenu supplémentaire pour un article. Les systèmes, les dispositifs et les procédés peuvent identifier un domaine pour les articles et le contenu et peuvent utiliser des modèles d'apprentissage machine pour classifier les articles et le contenu en catégories à l'aide d'étiquettes intelligentes pour le domaine. Les systèmes, les dispositifs et les procédés peuvent convertir les articles et le contenu en vecteurs de document à l'aide d'un modèle de langage spécifique au domaine pré-entraîné et générer un score de pertinence pour les articles et le contenu à l'aide des vecteurs de document. Les systèmes, les dispositifs et les procédés peuvent générer une liste de correspondances prédites qui comprend un contenu qui est similaire à l'article sur la base du score de pertinence. Les systèmes, les dispositifs et les procédés peuvent filtrer la liste de correspondances prédites sur la base d'une proximité temporelle pour générer une liste de contenu supplémentaire pour l'article.