Um framework para análise da relação entre tamanho e complexidade de conjuntos de dados

Na área de Reconhecimento de Padrões, um problema de classificação é dito complexo quando as observações de classes diferentes apresentam elevada semelhança. Ao reconhecer a estimativa de complexidade como um fator importante na obtenção de acurácia, a literatura propôs uma variedade de descritores...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Revista Brasileira de Computação Aplicada. 2021-05, Vol.13 (2), p.1-15
Hauptverfasser: Dos Santos, Mateus José, Brun, André Luiz, Silva, Ronan Assumpção
Format: Artikel
Sprache:eng
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Na área de Reconhecimento de Padrões, um problema de classificação é dito complexo quando as observações de classes diferentes apresentam elevada semelhança. Ao reconhecer a estimativa de complexidade como um fator importante na obtenção de acurácia, a literatura propôs uma variedade de descritores de complexidade. Porém, não se sabe a sensibilidade desses descritores quanto a variação do tamanho dos conjuntos de treinamento. Neste trabalho, este comportamento foi analisado. Os descritores foram medidos em 20.800 subconjuntos criados a partir de: i) 26 problemas de classificação, ii) 2 geradores e iii) 4 tamanhos. Os resultados comprovaram que a sensibilidade dos descritores ao tamanho é uma realidade, sendo menos perceptíveis em F1, F2, L2, N4, L3, T1, D2 e D3. Já as métricas F3, F4, N1, N2 e N3 são mais influenciadas por variações no número de instâncias presentes no conjunto.
ISSN:2176-6649
2176-6649
DOI:10.5335/rbca.v13i2.10898