Estudio del rendimiento de técnicas de minería de datos en la predicción de resultados académicos

El presente documento pretende establecer una primera comparación de diferentes métodos de predicción, la comparación se realiza en base a los resultados que se obtienen con cada método a la hora de predecir si los alumnos de la escuela aprobarán o suspenderán, en su primer intento, las asignaturas...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Mascort Colomer, Alejandro
Format: Dissertation
Sprache:spa
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator Mascort Colomer, Alejandro
description El presente documento pretende establecer una primera comparación de diferentes métodos de predicción, la comparación se realiza en base a los resultados que se obtienen con cada método a la hora de predecir si los alumnos de la escuela aprobarán o suspenderán, en su primer intento, las asignaturas pertenecientes al tercer cuatrimestre del grado (Q3). Los métodos que se emplean son la Regresión Logística, los Árboles de Decisión y los Support Vector Machine lineales. Para realizar este proyecto se sigue una famosa metodología empleada en proyectos de esta tipología, la metodología CRISP-DM, cada una de las etapas de dicha metodología está adaptada a este trabajo. La manipulación de datos, creación de modelos y obtención de resultados se realiza través del lenguaje de programación Python, destacando las librerías Pandas y SciKit-Learn. De los análisis de este trabajo se concluye que para la mayoría de las asignaturas del Q3, los dos grupos (aprobados y suspensos) no son separables linealmente entre sí y por esta razón los mejores resultados se obtienen de los Árboles de Decisión, a ello se le suma que en la mayoría de las asignaturas el número de aprobados es mucho mayor, y por ello, los resultados favorecen a este grupo. Los suspensos son predichos de forma acertada en más del 50%, únicamente para Electromagnetismo y Mecánica. En la sección de Trabajos Futuros de este proyecto se muestran algunos mecanismos que permitirían obtener mejores resultados para los métodos empleados y se sugieren posibles nuevos métodos.
format Dissertation
fullrecord <record><control><sourceid>csuc_XX2</sourceid><recordid>TN_cdi_csuc_recercat_oai_recercat_cat_2072_360914</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>oai_recercat_cat_2072_360914</sourcerecordid><originalsourceid>FETCH-csuc_recercat_oai_recercat_cat_2072_3609143</originalsourceid><addsrcrecordid>eNqdizsKAkEQRCcxEPUOcwFhP6IYy4oHMF-a7hYa5rNMzx5qAyOPMBfTAcHcoKh6PGpteNA8k0RL7GziQOKFQ65sc1kwCIJW8BI4lSfUTZCjWg7WgZ0SkyBKeYWqEuvsMtDHAwKVxQtG3ZrVA5zy7tsb016H--W2R51xTIycEPIYQX5Q0zWnbuyPzbk99P983s_2Tpc</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>dissertation</recordtype></control><display><type>dissertation</type><title>Estudio del rendimiento de técnicas de minería de datos en la predicción de resultados académicos</title><source>Recercat</source><creator>Mascort Colomer, Alejandro</creator><creatorcontrib>Mascort Colomer, Alejandro</creatorcontrib><description>El presente documento pretende establecer una primera comparación de diferentes métodos de predicción, la comparación se realiza en base a los resultados que se obtienen con cada método a la hora de predecir si los alumnos de la escuela aprobarán o suspenderán, en su primer intento, las asignaturas pertenecientes al tercer cuatrimestre del grado (Q3). Los métodos que se emplean son la Regresión Logística, los Árboles de Decisión y los Support Vector Machine lineales. Para realizar este proyecto se sigue una famosa metodología empleada en proyectos de esta tipología, la metodología CRISP-DM, cada una de las etapas de dicha metodología está adaptada a este trabajo. La manipulación de datos, creación de modelos y obtención de resultados se realiza través del lenguaje de programación Python, destacando las librerías Pandas y SciKit-Learn. De los análisis de este trabajo se concluye que para la mayoría de las asignaturas del Q3, los dos grupos (aprobados y suspensos) no son separables linealmente entre sí y por esta razón los mejores resultados se obtienen de los Árboles de Decisión, a ello se le suma que en la mayoría de las asignaturas el número de aprobados es mucho mayor, y por ello, los resultados favorecen a este grupo. Los suspensos son predichos de forma acertada en más del 50%, únicamente para Electromagnetismo y Mecánica. En la sección de Trabajos Futuros de este proyecto se muestran algunos mecanismos que permitirían obtener mejores resultados para los métodos empleados y se sugieren posibles nuevos métodos.</description><language>spa</language><publisher>Universitat Politècnica de Catalunya</publisher><subject>Avaluació ; Data mining ; Estudiants ; Informàtica ; Mineria de dades ; Student evaluation of teachers ; Àrees temàtiques de la UPC</subject><creationdate>2019</creationdate><rights>info:eu-repo/semantics/openAccess &lt;a href="http://creativecommons.org/licenses/by-nc-sa/3.0/es/"&gt;http://creativecommons.org/licenses/by-nc-sa/3.0/es/&lt;/a&gt;</rights><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>230,311,780,885,26972</link.rule.ids><linktorsrc>$$Uhttps://recercat.cat/handle/2072/360914$$EView_record_in_Consorci_de_Serveis_Universitaris_de_Catalunya_(CSUC)$$FView_record_in_$$GConsorci_de_Serveis_Universitaris_de_Catalunya_(CSUC)$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>Mascort Colomer, Alejandro</creatorcontrib><title>Estudio del rendimiento de técnicas de minería de datos en la predicción de resultados académicos</title><description>El presente documento pretende establecer una primera comparación de diferentes métodos de predicción, la comparación se realiza en base a los resultados que se obtienen con cada método a la hora de predecir si los alumnos de la escuela aprobarán o suspenderán, en su primer intento, las asignaturas pertenecientes al tercer cuatrimestre del grado (Q3). Los métodos que se emplean son la Regresión Logística, los Árboles de Decisión y los Support Vector Machine lineales. Para realizar este proyecto se sigue una famosa metodología empleada en proyectos de esta tipología, la metodología CRISP-DM, cada una de las etapas de dicha metodología está adaptada a este trabajo. La manipulación de datos, creación de modelos y obtención de resultados se realiza través del lenguaje de programación Python, destacando las librerías Pandas y SciKit-Learn. De los análisis de este trabajo se concluye que para la mayoría de las asignaturas del Q3, los dos grupos (aprobados y suspensos) no son separables linealmente entre sí y por esta razón los mejores resultados se obtienen de los Árboles de Decisión, a ello se le suma que en la mayoría de las asignaturas el número de aprobados es mucho mayor, y por ello, los resultados favorecen a este grupo. Los suspensos son predichos de forma acertada en más del 50%, únicamente para Electromagnetismo y Mecánica. En la sección de Trabajos Futuros de este proyecto se muestran algunos mecanismos que permitirían obtener mejores resultados para los métodos empleados y se sugieren posibles nuevos métodos.</description><subject>Avaluació</subject><subject>Data mining</subject><subject>Estudiants</subject><subject>Informàtica</subject><subject>Mineria de dades</subject><subject>Student evaluation of teachers</subject><subject>Àrees temàtiques de la UPC</subject><fulltext>true</fulltext><rsrctype>dissertation</rsrctype><creationdate>2019</creationdate><recordtype>dissertation</recordtype><sourceid>XX2</sourceid><recordid>eNqdizsKAkEQRCcxEPUOcwFhP6IYy4oHMF-a7hYa5rNMzx5qAyOPMBfTAcHcoKh6PGpteNA8k0RL7GziQOKFQ65sc1kwCIJW8BI4lSfUTZCjWg7WgZ0SkyBKeYWqEuvsMtDHAwKVxQtG3ZrVA5zy7tsb016H--W2R51xTIycEPIYQX5Q0zWnbuyPzbk99P983s_2Tpc</recordid><startdate>20190716</startdate><enddate>20190716</enddate><creator>Mascort Colomer, Alejandro</creator><general>Universitat Politècnica de Catalunya</general><scope>XX2</scope></search><sort><creationdate>20190716</creationdate><title>Estudio del rendimiento de técnicas de minería de datos en la predicción de resultados académicos</title><author>Mascort Colomer, Alejandro</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-csuc_recercat_oai_recercat_cat_2072_3609143</frbrgroupid><rsrctype>dissertations</rsrctype><prefilter>dissertations</prefilter><language>spa</language><creationdate>2019</creationdate><topic>Avaluació</topic><topic>Data mining</topic><topic>Estudiants</topic><topic>Informàtica</topic><topic>Mineria de dades</topic><topic>Student evaluation of teachers</topic><topic>Àrees temàtiques de la UPC</topic><toplevel>online_resources</toplevel><creatorcontrib>Mascort Colomer, Alejandro</creatorcontrib><collection>Recercat</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>Mascort Colomer, Alejandro</au><format>dissertation</format><genre>dissertation</genre><ristype>THES</ristype><btitle>Estudio del rendimiento de técnicas de minería de datos en la predicción de resultados académicos</btitle><date>2019-07-16</date><risdate>2019</risdate><abstract>El presente documento pretende establecer una primera comparación de diferentes métodos de predicción, la comparación se realiza en base a los resultados que se obtienen con cada método a la hora de predecir si los alumnos de la escuela aprobarán o suspenderán, en su primer intento, las asignaturas pertenecientes al tercer cuatrimestre del grado (Q3). Los métodos que se emplean son la Regresión Logística, los Árboles de Decisión y los Support Vector Machine lineales. Para realizar este proyecto se sigue una famosa metodología empleada en proyectos de esta tipología, la metodología CRISP-DM, cada una de las etapas de dicha metodología está adaptada a este trabajo. La manipulación de datos, creación de modelos y obtención de resultados se realiza través del lenguaje de programación Python, destacando las librerías Pandas y SciKit-Learn. De los análisis de este trabajo se concluye que para la mayoría de las asignaturas del Q3, los dos grupos (aprobados y suspensos) no son separables linealmente entre sí y por esta razón los mejores resultados se obtienen de los Árboles de Decisión, a ello se le suma que en la mayoría de las asignaturas el número de aprobados es mucho mayor, y por ello, los resultados favorecen a este grupo. Los suspensos son predichos de forma acertada en más del 50%, únicamente para Electromagnetismo y Mecánica. En la sección de Trabajos Futuros de este proyecto se muestran algunos mecanismos que permitirían obtener mejores resultados para los métodos empleados y se sugieren posibles nuevos métodos.</abstract><pub>Universitat Politècnica de Catalunya</pub><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language spa
recordid cdi_csuc_recercat_oai_recercat_cat_2072_360914
source Recercat
subjects Avaluació
Data mining
Estudiants
Informàtica
Mineria de dades
Student evaluation of teachers
Àrees temàtiques de la UPC
title Estudio del rendimiento de técnicas de minería de datos en la predicción de resultados académicos
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-10T09%3A20%3A39IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-csuc_XX2&rft_val_fmt=info:ofi/fmt:kev:mtx:dissertation&rft.genre=dissertation&rft.btitle=Estudio%20del%20rendimiento%20de%20t%C3%A9cnicas%20de%20miner%C3%ADa%20de%20datos%20en%20la%20predicci%C3%B3n%20de%20resultados%20acad%C3%A9micos&rft.au=Mascort%20Colomer,%20Alejandro&rft.date=2019-07-16&rft_id=info:doi/&rft_dat=%3Ccsuc_XX2%3Eoai_recercat_cat_2072_360914%3C/csuc_XX2%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true