Covid Data Analytics: Repositório de Dados Provenientes de Múltiplas Fontes sobre a Pandemia de COVID-19 no Brasil
Uma estratégia para melhor compreender as diversas facetas e possíveis impactos da pandemia de COVID-19 na sociedade consiste na extração de informação e conhecimento a partir de dados provenientes de diversas fontes oficiais e não oficiais. A importância desse tema fomentou a publicação de diversos...
Gespeichert in:
Hauptverfasser: | , , , , , , |
---|---|
Format: | Dataset |
Sprache: | por |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Uma estratégia para melhor compreender as diversas facetas e possíveis impactos da pandemia de COVID-19 na sociedade consiste na extração de informação e conhecimento a partir de dados provenientes de diversas fontes oficiais e não oficiais. A importância desse tema fomentou a publicação de diversos artigos científicos que investigam aspectos relacionados à pandemia de COVID-19 no Brasil por meio de análises de dados. Alguns trabalhos, por exemplo, fornecem caracterizações e descrições da evolução da doença no país~\cite{ranzani2021characterisation}, considerando, inclusive, a subnotificação de casos pelas agências oficiais. Outros modelam e preveem a evolução da COVID-19, utilizando dados referentes aos primeiros meses da pandemia e empregando diferentes métodos ou mesmo utilizando dados de geolocalização e de dinâmica populacional. Nesse contexto, é importante que, sempre que possível, os dados utilizados para as pesquisas sejam disponibilizados à comunidade científica, seja para fins de replicabilidade dos resultados encontrados, seja para a promoção de novas investigações. Os dados disponibilizados no repositório CDA se referem ao período entre 23 de fevereiro de 2020 e 8 de maio de 2021. Esse repositório agrega 1.508 arquivos, classificados em dois tipos principais: (i) bases de dados e tabelas extraídas das fontes descritas anteriormente; e (ii) artigos, relatórios, mapas e gráficos produzidos pelos integrantes do projeto a partir da análise dos dados coletados Dados de Fontes Externas Estes arquivos representam 8\% do total de arquivos que compõem o repositório e estão distribuídos da seguinte maneira: Séries temporais com indicadores econômicos das Unidades Federativas do Brasil e da União em formato .csv, com aproximadamente 18.400 registros; 7 scripts de tratamento de dados em formato .py. 5 arquivos com a contagem do número de tweets e retweets coletados semanalmente utilizando 13 palavras-chave (“corona”, “covid”, “coronavirus”, “covid19”, “quarentena”,“hidroxicloroquina”, “cloroquina”, “confinamento”, “distanciamento social”, “aglomeração”, “aglomerações”, “sars” e “covid-19”) formato .csv 3 arquivos do Google Trends no formato .csv com 249 registros contendo 124 termos pré-selecionados que têm relação com a pandemia e o percentual relativo de buscas na web nos níveis regional e nacional. %\ana{de novo, o que tem nestes csvs?}. 7 arquivos como dados anonimizados do Instagram no formato .csv com 90.787 hashtags contendo os termos \#demito, \#de |
---|---|
DOI: | 10.5281/zenodo.5176797 |