Missing data imputation of climate datasets: implications to modeling extreme drought events

Time series from weather stations in Brazil have several missing data, outliers and spurious zeroes. In order to use this dataset in risk and meteorological studies, one should take into account alternative methodologies to deal with these problems. This article describes the statistical imputation...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Revista Brasileira de Meteorologia 2014-03, Vol.29 (1), p.21-28
Hauptverfasser: Ferrari, Gláucia Tatiana, Ozaki, Vitor
Format: Artikel
Sprache:eng
Schlagworte:
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Time series from weather stations in Brazil have several missing data, outliers and spurious zeroes. In order to use this dataset in risk and meteorological studies, one should take into account alternative methodologies to deal with these problems. This article describes the statistical imputation and quality control procedures applied to a database of daily precipitation from meteorological stations located in the State of Parana, Brazil. After imputation, the data went through a process of quality control to identify possible errors, such as: identical precipitation over seven consecutive days and precipitation values that differ significantly from the values in neighboring weather stations. Next, we used the extreme value theory to model agricultural drought, considering the maximum number of consecutive days with precipitation below 7 mm for the period between January and February, in the main soybean agricultural regions in the State of Parana. Este artigo relata o procedimento utilizado na reconstrução de um banco de dados contínuo de precipitação diária de estações meteorológicas localizadas no Estado do Paraná, Brasil. Após a imputação, os dados passaram por um processo de controle de qualidade que teve como objetivo identificar possíveis erros como precipitação idêntica em sete dias consecutivos (não aplicados a dados de precipitação zero) e valores de precipitação que diferem significativamente dos valores em estações meteorológicas vizinhas. Com o banco de dados contínuo, o interesse foi utilizar a teoria de valores extremos para modelar a seca agrícola, considerada como sendo o número máximo de dias consecutivos com precipitação abaixo de 7 mm para o período entre janeiro e fevereiro, crítica para a fase de enchimento de grãos da soja nas principais regiões produtoras do Estado do Paraná.
ISSN:0102-7786
1982-4351
0102-7786
DOI:10.1590/S0102-77862014000100003