The reasons why the Regression Tree Method is more suitable than General Linear Model to analyze complex educational datasets

Any quantitative method is shaped by certain rules or assumptions which constitute its own rationale. It is not by chance that these assumptions determine the conditions and constraints which permit the evidence to be constructed. In this article, we argue why the Regression Tree Method’s rationale...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Revista portuguesa de educação 2021-12, Vol.34 (2), p.42-63
Hauptverfasser: Gomes, Cristiano Mauro Assis, Lemos, Gina C, Jelihovschi, Enio G.
Format: Artikel
Sprache:eng ; por
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Any quantitative method is shaped by certain rules or assumptions which constitute its own rationale. It is not by chance that these assumptions determine the conditions and constraints which permit the evidence to be constructed. In this article, we argue why the Regression Tree Method’s rationale is more suitable than General Linear Model to analyze complex educational datasets. Furthermore, we apply the CART algorithm of Regression Tree Method and the Multiple Linear Regression in a model with 53 predictors, taking as outcome the students’ scores in reading of the 2011’s edition of the National Exam of Upper Secondary Education (ENEM; N = 3,670,089), which is a complex educational dataset. This empirical comparison illustrates how the Regression Tree Method is better suitable than General Linear Model for furnishing evidence about non-linear relationships, as well as, to deal with nominal variables with many categories and ordinal variables. We conclude that the Regression Tree Method constructs better evidence about the relationships between the predictors and the outcome in complex datasets. Cualquier método cuantitativo está conformado por ciertas reglas o postulados que constituyen su propia racionalidad. No por casualidad, estos postulados determinan las condiciones y restricciones sobre las cuales se puede construir la evidencia En este artículo, argumentamos por qué la racionalidad del Método de Árbol de Regresión es más apropiada que el Modelo Lineal General para analizar datos educativos complejos. Además, se aplicó el algoritmo CART del Método de Regresión de Árbol, así como la Regresión Linear Múltiple, en un modelo con 53 predictores, tomando como variable de respuesta el desempeño de los estudiantes en lectura de la edición 2011 del Examen Nacional de Educación Secundaria (ENEM; N = 3.670.089), que es un dato educativo complejo. Esta comparación empírica ilustra cómo el Método de de Árbol de Regresión es superior al Modelo Linear General al proporcionar evidencia de relaciones no lineales, así como al tratar con variables nominales con muchas categorías y variables ordinales. Llegamos a la conclusión de que el Método de Árbol de Regresión genera mejores evidencias sobre las relaciones entre los predictores y el variable de respuesta en datos complejos. Qualquer método quantitativo é formatado por certas regras ou postulados que constituem a sua própria racionalidade. Não fortuitamente, esses postulados determinam as condições e constrangime
ISSN:0871-9187
2183-0452
DOI:10.21814/rpe.18044