Machine Learning for the Evolutionary Analysis of Breast Cancer

The use of machine learning allows the creation of a predictive data model, as a result of the analysis in a data set with286 instances and nine attributes belonging to the Institute of Oncology of the University Medical Center. Ljubljana. Based onthis situation, the data are preprocessed by applyin...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Journal of Science and Research: Revista Ciencia e Investigación 2018, Vol.3 (1), p.44-49
Hauptverfasser: Merchán Carreño, Edwin Joao, Martínez Béjar, Rodrigo, Mackenzie Rivero, Alexander, Rodríguez Rodríguez, Alberto
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:The use of machine learning allows the creation of a predictive data model, as a result of the analysis in a data set with286 instances and nine attributes belonging to the Institute of Oncology of the University Medical Center. Ljubljana. Based onthis situation, the data are preprocessed by applying intelligent data analysis techniques to eliminate missing values as well as theevaluation of each attribute that allows the optimization of results. We used several classification algorithms including J48 trees,random forest, bayes net, naive bayes, decision table, in order to obtain one that given the characteristics of the data, would allowthe best classification percentage and therefore a better matrix of confusion, Using 66 % of the data for learning and 33 % forvalidating the model. Using this model, a predictor with a 71,134 % effectiveness is obtained to estimate or not the recurrence ofbreast cancer El uso del aprendizaje automático permite la creación de un modelo predictivo de datos, como resultado del análisis en un conjunto de datos con 286 instancias y nueve atributos pertenecientes al Instituto de Oncología del Centro Médico Universitario.Ljubljana. En función de esta situación, los datos se preprocesan aplicando técnicas inteligentes de análisis de datos para eliminarlos valores perdidos, así como la evaluación de cada atributo que permite la optimización de resultados. Utilizamos varios algoritmos de clasificación incluyendo ́arboles J48, bosque aleatorio, bayes net, bayes naive, tabla de decisiones, para obtener uno que, dadas las características de los datos, permita el mejor porcentaje de clasificación y por lo tanto una mejor matriz de confusión, utilizando 66 % de los datos para aprendizaje y 33 % para validar el modelo. Con este modelo, se obtiene un predictor con una eficacia del 71,134 % para estimar o no la recurrencia del cáncer de mama.
ISSN:2528-8083