Estudi del rendiment de tècniques de mineria de dades en la predicció de resultats acadèmics

El present document tracta sobre l’anàlisi del rendiment de tècniques de mineria de dades aplicades en la predicció de l’aprovat o suspès dels estudiants de l’ETSEIB en assignatures corresponents al Q3. La mineria de dades és el procés d’extracció d’informació significativa dins d’un conjunt de dade...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Heng, Montse Jing
Format: Dissertation
Sprache:cat
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:El present document tracta sobre l’anàlisi del rendiment de tècniques de mineria de dades aplicades en la predicció de l’aprovat o suspès dels estudiants de l’ETSEIB en assignatures corresponents al Q3. La mineria de dades és el procés d’extracció d’informació significativa dins d’un conjunt de dades, permetent identificar patrons i arribar a predir futures situacions. Les tècniques de predicció emprades só n l’arbre de decisió i el mecanisme Bagging prenent l’arbre de decisió com a estimador base. Tot el procés d’anàlisi ha estat adaptat a la metodologia CRISP (un dels models referència en la mineria de dades), des de la preparació de les dades fins la vali dació dels models. A partir dels resultats obtinguts en la validació s’han pogut contrastar els dos mètodes de predicció utilitzats. Les eines utilitzades en el treball giren entorn al llenguatge de programació Python i són totes de programari lliure. Con cretament, s’ha fet ús de les llibreries Pandas i scikit - learn i la distribució Anaconda com a IDE. La conclusió principal que s’extreu del projecte és que les dades que es disposen són poc representatives per tal de poder ser predites. Les precisions de predicció són relativament baixes en els dos mecanismes utilitzats. Al final del treball es troba una secció de treball futur on es proposen alternatives d’estudi per tal d’aprofundir l’anàlisi.