Time series classification with Shapelets : Application to predictive maintenance on event logs

Dans cette thèse, nous nous intéressons à l'apprentissage automatique, et plus particulièrement à la classification supervisée de séries temporelles et son application à la maintenance prédictive. Notre premier objectif est d'utiliser les shapelets, motifs extraits des séries temporelles,...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Guillaume, Antoine
Format: Dissertation
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Dans cette thèse, nous nous intéressons à l'apprentissage automatique, et plus particulièrement à la classification supervisée de séries temporelles et son application à la maintenance prédictive. Notre premier objectif est d'utiliser les shapelets, motifs extraits des séries temporelles, pour construire un algorithme de classification supervisée, permettant de prédire la classe d'une série en fonction de la présence de ces motifs dans la série. Nous proposons plusieurs contributions pour améliorer leurs performances, telles que l'ajout de la notion de dilatation et l'ajout d'un nouveau descripteur qui, à partir d'un seuil de distance, compte le nombre d'occurrences d'une shapelet dans une série. Nous présentons ensuite un algorithme de classification intégrant ces contributions et évaluons ses performances par rapport aux méthodes existantes sur les archives de données de l'Université d'East Anglia (UEA) et de California Riverside (UCR). Nous étudions ensuite les méthodes de classification des séries temporelles pouvant être utilisées pour la maintenance prédictive. Nous formalisons d'abord la tâche d'apprentissage, puis présentons les méthodes utilisées dans la littérature pour produire des modèles adaptés à la maintenance prédictive. Ensuite, nous introduisons un cas d'utilisation industrielle de maintenance prédictive sur des journaux d'événements, issus de distributeurs automatiques de billets. Enfin, nous présentons un protocole expérimental, incluant une métrique pour estimer le coût du système de maintenance, et un nouveau modèle de classification spécifiquement conçu pour cette tâche. In this thesis, we are interested in machine learning, and more specifically in supervised classification of time series and its application to predictive maintenance. Our first objective is to use shapelets, patterns extracted from time series, to build a supervised classification algorithm, allowing to predict the class of a series based on the presence of these patterns in the series. We propose several contributions to improve their performance, such as the addition of the notion of dilation and a new descriptor which, given a distance threshold, counts the number of occurrences of a shapelet in a series. We then present a classification algorithm using these contributions and evaluate its performance against existing methods on the University of East Anglia (UEA) and California Riverside (UCR) data archives.Then, we study time series classification methods that