PERFORMANCE DA MODELAGEM PARA CLASSIFICAÇÃO DE SÍTIOS FLORESTAIS EM BASES DE DADOS COM OUTLIERS
As informações utilizadas para estimativa da capacidade produtiva de sítios florestais provêm de bases de dados de inventário florestal que podem conter observações discrepantes (outliers). Assim, torna-se necessário a análise de consistência para exclusão destes. Porém, os outliers podem representa...
Gespeichert in:
Veröffentlicht in: | Nativa (Sinop) 2021-02, Vol.9 (1), p.54-61 |
---|---|
Hauptverfasser: | , , , , , |
Format: | Artikel |
Sprache: | eng |
Online-Zugang: | Volltext |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | As informações utilizadas para estimativa da capacidade produtiva de sítios florestais provêm de bases de dados de inventário florestal que podem conter observações discrepantes (outliers). Assim, torna-se necessário a análise de consistência para exclusão destes. Porém, os outliers podem representar determinado padrão de crescimento existente na floresta, logo a exclusão destes pode ser uma ação equivocada. Objetivou-se comparar a performance de diferentes técnicas de modelagem para classificação de sítios florestais, considerando uma base de dados com a presença de outliers. Utilizou-se pares de dados de idade e altura dominante (HD) de parcelas permanentes de Eucalyptus urophyla x Eucalyptus grandis localizadas no norte de Minas Gerais. Foi simulado um outlier de HD. A base de dados foi modelada, com e sem presença de outliers, por regressão linear (RL) e redes neurais artificiais Multilayer Perceptron (MLP) e Radial Basis Function (RBF). Os métodos foram analisados por meio dos critérios estatísticos de precisão: bias, raiz quadrada do erro médio, correlação de Pearson, erro médio percentual e gráfico de dispersão residual. A MLP foi superior para estimativa do índice de sítio. Portanto, a MLP é indicada para classificação de sítios florestais quando há presença de outliers na base de dados.
Palavras-chave: índice de sítio; inventário florestal; dados discrepantes.
Performance of modeling for classification of forest sites in databases with outliers
ABSTRACT: The information used to estimate the productive capacity of forest sites comes from forest inventory databases that may contain discrepant observations (outliers). Thus, consistency analysis is required to exclude these. However, the outliers may represent a certain growth pattern existing in the forest, so their exclusion may be a mistaken action. The objective was to compare the performance of different modeling techniques for forest site classification, considering a database with the presence of outliers. We used pairs of data of age and dominant height (HD) of permanent parcels of Eucalyptus urophila x Eucalyptus grandis located in the north of Minas Gerais. A HD outlier was simulated. The database was modeled, with and without the presence of outliers, by linear regression (RL) and artificial neural networks Multilayer Perceptron (MLP) and Radial Basis Function (RBF). The methods were analyzed by means of precision statistical criteria: bias, square root of mean error, Pearson correlatio |
---|---|
ISSN: | 2318-7670 2318-7670 |
DOI: | 10.31413/nativa.v9i1.11202 |