CAPACIDADE PREDITIVA DO MODELO RANDOM FOREST PARA ÓBITO EM PACIENTES COM COVID-19: UMA ANÁLISE DE DADOS NO CONTEXTO DA PANDEMIA
O uso do machine learning foi impulsionado pela pandemia de COVID-19 para enfrentar desafios na saúde pública, auxiliando na detecção de casos, grupos de risco e desenvolvimento de modelos preditivos, fornecendo informações valiosas para controlar e prevenir a propagação da doença. O objetivo desse...
Gespeichert in:
Veröffentlicht in: | The Brazilian journal of infectious diseases 2023-10, Vol.27, p.102900, Article 102900 |
---|---|
Hauptverfasser: | , , , |
Format: | Artikel |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | O uso do machine learning foi impulsionado pela pandemia de COVID-19 para enfrentar desafios na saúde pública, auxiliando na detecção de casos, grupos de risco e desenvolvimento de modelos preditivos, fornecendo informações valiosas para controlar e prevenir a propagação da doença. O objetivo desse estudo é avaliar a capacidade preditiva de um modelo randomForest acerca do óbito em pacientes com diagnóstico confirmado para Covid-19. Este é um estudo transversal que utilizou dados de casos notificados no E-SUS VS do Espírito Santo de janeiro de 2020 a outubro de 2022. Foi criado um modelo Random Forest usando 70% dos dados para treinamento, com downsampling da classe majoritária. As previsões foram feitas no conjunto de teste e avaliadas usando tabela 2 × 2. O estudo fornece informações sobre as características associadas ao óbito e a capacidade do modelo de prever corretamente esses casos. No estudo, 111.024 pacientes foram randomizados para o grupo teste e 259.053 para o grupo treino, sendo reduzido para 7.766 após downsampling. As previsões do modelo resultaram em 90.644 verdadeiros negativos e 1.389 verdadeiros positivos, com 294 falsos positivos e 18.690 falsos negativos. A sensibilidade do modelo foi de 82,5%, indicando sua capacidade de identificar corretamente os casos de óbito. A especificidade foi de 82,9%, evidenciando a habilidade de classificar corretamente os casos de não óbito. A acurácia geral do modelo foi de 83,9%. O valor preditivo positivo foi de 6,9%, o que significa que das previsões de óbito, apenas 6,9% eram corretas. Por outro lado, o valor preditivo negativo foi de 99,7%, indicando a alta precisão das previsões de não óbito. Esses resultados demonstram um desempenho satisfatório do modelo na identificação precisa dos casos de óbito, com alta especificidade e acurácia geral. O modelo identificou corretamente dos casos de óbito, com sensibilidade de 82,5% e especificidade de 82,9%. A acurácia geral do modelo foi de 83,9%, indicando um desempenho consistente na classificação geral dos pacientes. No entanto, o valor preditivo positivo foi baixo, indicando que uma proporção relativamente pequena das previsões de óbito foi realmente correta, principalmente devido à baixa proporção de óbitos na amostra. O valor preditivo negativo foi alto, o que demonstra a confiabilidade das previsões de não óbito. Embora o modelo seja importante na identificação de casos de óbito, é necessário melhorar sua precisão na previsão dos casos positivos. |
---|---|
ISSN: | 1413-8670 |
DOI: | 10.1016/j.bjid.2023.102900 |