AUTOMATED INFORMATION EXTRACTION AND ENRICHMENT IN PATHOLOGY REPORT USING NATURAL LANGUAGE PROCESSING

In one example, a method being performed by a computer system comprises: receiving an image file containing a pathology report; performing an image recognition operation on the image file to extract input text strings; detecting, using a natural language processing (NLP) model, entities from the inp...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: SHARMA, Vishakha, PANDIT, Yogesh, BALASUBRAMANIAN, Ram
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:In one example, a method being performed by a computer system comprises: receiving an image file containing a pathology report; performing an image recognition operation on the image file to extract input text strings; detecting, using a natural language processing (NLP) model, entities from the input text strings, each entity including a label and a value; extracting, using the NLP model, the values of the entities from the input text strings; converting, based on a mapping table that maps entities and values to pre-determined terminologies, the values of at least some of the entities to the corresponding pre-determined terminologies; and generating a post-processed pathology report including the entities detected from the input text strings and the corresponding pre-determined terminologies. Dans un exemple, l'invention concerne un procédé mis en œuvre par un système informatique consistant à : recevoir un fichier d'image contenant un rapport de pathologie ; réaliser une opération de reconnaissance d'image sur le fichier d'image pour extraire des chaînes de texte d'entrée ; détecter, à l'aide d'un modèle de traitement de langage naturel (NLP), des entités à partir des chaînes de texte d'entrée, chaque entité comprenant une étiquette et une valeur ; extraire, à l'aide du modèle NLP, des valeurs des entités à partir des chaînes de texte d'entrée ; convertir, sur la base d'une table de mise en correspondance qui met en correspondance des entités et des valeurs avec des terminologies prédéfinies, les valeurs d'au moins une partie des entités en terminologies prédéfinies correspondantes ; et générer un rapport de pathologie post-traité comprenant les entités détectées à partir des chaînes de texte d'entrée et des terminologies prédéfinies correspondantes.