Um framework para análise da relação entre tamanho e complexidade de conjuntos de dados
Na área de Reconhecimento de Padrões, um problema de classificação é dito complexo quando as observações de classes diferentes apresentam elevada semelhança. Ao reconhecer a estimativa de complexidade como um fator importante na obtenção de acurácia, a literatura propôs uma variedade de descritores...
Gespeichert in:
Veröffentlicht in: | Revista Brasileira de Computação Aplicada. 2021-05, Vol.13 (2), p.1-15 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | eng |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Na área de Reconhecimento de Padrões, um problema de classificação é dito complexo quando as observações de classes diferentes apresentam elevada semelhança. Ao reconhecer a estimativa de complexidade como um fator importante na obtenção de acurácia, a literatura propôs uma variedade de descritores de complexidade. Porém, não se sabe a sensibilidade desses descritores quanto a variação do tamanho dos conjuntos de treinamento. Neste trabalho, este comportamento foi analisado. Os descritores foram medidos em 20.800 subconjuntos criados a partir de: i) 26 problemas de classificação, ii) 2 geradores e iii) 4 tamanhos. Os resultados comprovaram que a sensibilidade dos descritores ao tamanho é uma realidade, sendo menos perceptíveis em F1, F2, L2, N4, L3, T1, D2 e D3. Já as métricas F3, F4, N1, N2 e N3 são mais influenciadas por variações no número de instâncias presentes no conjunto. |
---|---|
ISSN: | 2176-6649 2176-6649 |
DOI: | 10.5335/rbca.v13i2.10898 |