Leveraging Irregular Time Series Data for Enhanced IoT Sensor Classification in Smart Buildings
Mangel på etablerte navnekonvensjoner for IoT-sensorer (Internet of Things) i smart bygg kan resultere i varierte navnekonvensjoner mellom ulike bygninger. Dette kan komplisere prosessen med å integrere data fra ulike kilder inn i et felles administrasjonssystem. Denne masteroppgaven, utført i samar...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Dissertation |
Sprache: | eng |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Mangel på etablerte navnekonvensjoner for IoT-sensorer (Internet of Things) i smart bygg kan resultere i varierte navnekonvensjoner mellom ulike bygninger. Dette kan komplisere prosessen med å integrere data fra ulike kilder inn i et felles administrasjonssystem. Denne masteroppgaven, utført i samarbeid med Piscada, tar for seg utfordringen med å klassifisere IoT-sensordata fra bygninger basert på tidsseriene de produserer. Hovedmålet var å utvikle et klassifiseringssystem som er i stand til å identifisere ulike typer sensorer, samtidig som det effektivt håndterer volumet, variasjonen og uregelmessighetene som naturlig kan følge data samlet inn fra ulike bygningsmiljøer. Ved å kategorisere og merke sensordata har systemet som formål å hjelpe til med å øke driftseffektiviteten, og legge til rette for bedre integrasjon av smart bygg i felles administrasjonssystemer.
Etablerte karakteristikk ekstraksjons biblioteker som Tsfresh, TSFEL og Catch22 ble testet, sammen med en ny ekstraksjonsmetode som benyttet seg direkte av den rå, uregelmessige dataen generert av hendelsesdrevne sensorer. Mens bibliotekene krever konvertering av uregelmessige til regelmessige intervaller, noe som kan føre til tap av informasjon, utnytter den nye metoden de irregulære intervallene som en karakteristisk av sensordataen. Denne metoden henter karakteristiske trekk fra ulike representasjoner av den samme tidsserien, slik som intervaller som funksjon av tid, forholdet mellom verdier og intervaller, og spesifikke interessante hendelser i dataen, slik som lengre intervaller og deres tilsvarende verdier. Ved å utnytte uregelmessighetene i dataen fanger metoden opp et mer nyansert bilde av tidsseriene.
Den irregulære intervall ekstraksjonsmetoden ga bedre ytelse ved klassifisering sammenlignet med de etablerte bibliotekene. Klassifisering av individuelle sensortyper viste seg å være vanskelig på grunn av høy variasjon innad i klassene, samt mye likhet og overlapp blant klassene, noe som gjorde klassifisering av grupperte sensor-klasser mer praktiske og presist. Klassifisering ble utført med en histogram gradient boosting modell, hvor den irregulære ekstraksjonsmetoden oppnådde best resultater. TSFEL viste også gode prestasjoner, mens Catch22 og Tsfresh hadde de laveste ytelsene totalt sett. Den irregulære metoden oppnådde en nøyaktighet på 96,47% for grupperte klasser, sammenlignet med 90,91% for TSFEL, og 87,41% og 87,22% henholdsvis for Tsfresh og Catch22. Presisjon og dekning ga videre |
---|