IMPROVED MACHINE LEARNING CLASSIFICATION WITH MODEL QUALITY PREDICTION

An embodiment may include a machine learning based classifier that maps input observations into respective categories and a database containing a corpus of training data for the classifier. The training data includes a plurality of entries, each entry having an observation respectively associated wi...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: JAYARAMAN, BASKAR
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:An embodiment may include a machine learning based classifier that maps input observations into respective categories and a database containing a corpus of training data for the classifier. The training data includes a plurality of entries, each entry having an observation respectively associated with a ground truth category thereof. A computing device may be configured to select, from the training data, a plurality of subsets each containing a different number of entries. The computing device may also be configured to, for each particular subset: (i) divide the particular subset into a training portion and a validation portion, (ii) train the classifier with the training portion, (iii) provide the validation portion as input to the classifier as trained, and (iv) based on how entries of the validation portion are mapped to the categories, determine a respective precision for the particular subset. Une réalisation peut comprendre un classificateur fondé sur apprentissage automatique qui illustre des observations dentrées dans des catégories respectives et une base de données contenant un corpus de données de formation pour classificateur. Les données de formation comprennent une pluralité dentrées, chaque entrée ayant une observation associée respectivement à une catégorie de réalité de terrain de cette dernière. Un dispositif informatique peut être configuré pour sélectionner, à partir des données de formation, une pluralité de sous-ensembles, chacun comprenant un différent nombre dentrées. Le dispositif informatique peut également être configuré pour faire ce qui suit pour chaque sous-ensemble en particulier : (i) diviser le sous-ensemble en particulier en une partie de formation et une partie de validation, (ii) entraîner le classificateur avec la partie de formation, (iii) fournir la partie de validation comme entrée au classificateur tel quentraîné, et (iv) d'après la manière dont des entrées de la partie de validation sont illustrées aux catégories, déterminer une précision respective pour le sous-ensemble en particulier.