Covid Data Analytics: Repositório de Dados Provenientes de Múltiplas Fontes sobre a Pandemia de COVID-19 no Brasil

Uma estratégia para melhor compreender as diversas facetas e possíveis impactos da pandemia de COVID-19 na sociedade consiste na extração de informação e conhecimento a partir de dados provenientes de diversas fontes oficiais e não oficiais. A importância desse tema fomentou a publicação de diversos...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: Moreira, Pedro Victor Xavier, Franco, Ramon Adrian Salinas, Fonseca, Rodrigo Machado, Prado, Alan Cabral Trindade, Luvison Leal, Mendes, Gabriel Nunes, Rezende, Turi Andrade Vasconcelos
Format: Dataset
Sprache:por
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Uma estratégia para melhor compreender as diversas facetas e possíveis impactos da pandemia de COVID-19 na sociedade consiste na extração de informação e conhecimento a partir de dados provenientes de diversas fontes oficiais e não oficiais. A importância desse tema fomentou a publicação de diversos artigos científicos que investigam aspectos relacionados à pandemia de COVID-19 no Brasil por meio de análises de dados. Alguns trabalhos, por exemplo, fornecem caracterizações e descrições da evolução da doença no país~\cite{ranzani2021characterisation}, considerando, inclusive, a subnotificação de casos pelas agências oficiais. Outros modelam e preveem a evolução da COVID-19, utilizando dados referentes aos primeiros meses da pandemia e empregando diferentes métodos ou mesmo utilizando dados de geolocalização e de dinâmica populacional. Nesse contexto, é importante que, sempre que possível, os dados utilizados para as pesquisas sejam disponibilizados à comunidade científica, seja para fins de replicabilidade dos resultados encontrados, seja para a promoção de novas investigações. Os dados disponibilizados no repositório CDA se referem ao período entre 23 de fevereiro de 2020 e 8 de maio de 2021. Esse repositório agrega 1.508 arquivos, classificados em dois tipos principais: (i) bases de dados e tabelas extraídas das fontes descritas anteriormente; e (ii) artigos, relatórios, mapas e gráficos produzidos pelos integrantes do projeto a partir da análise dos dados coletados Dados de Fontes Externas Estes arquivos representam 8\% do total de arquivos que compõem o repositório e estão distribuídos da seguinte maneira: Séries temporais com indicadores econômicos das Unidades Federativas do Brasil e da União em formato .csv, com aproximadamente 18.400 registros; 7 scripts de tratamento de dados em formato .py. 5 arquivos com a contagem do número de tweets e retweets coletados semanalmente utilizando 13 palavras-chave (“corona”, “covid”, “coronavirus”, “covid19”, “quarentena”,“hidroxicloroquina”, “cloroquina”, “confinamento”, “distanciamento social”, “aglomeração”, “aglomerações”, “sars” e “covid-19”) formato .csv 3 arquivos do Google Trends no formato .csv com 249 registros contendo 124 termos pré-selecionados que têm relação com a pandemia e o percentual relativo de buscas na web nos níveis regional e nacional. %\ana{de novo, o que tem nestes csvs?}. 7 arquivos como dados anonimizados do Instagram no formato .csv com 90.787 hashtags contendo os termos \#demito, \#de
DOI:10.5281/zenodo.5176797