Bing COVID-19
Os dados de COVID-19 do Bing incluem os casos confirmados, fatais e recuperados de todas as regiões, atualizados diariamente. O Rastreador de COVID-19 do Bing reflete esses dados.
O Bing coleta dados de várias fontes confiáveis e confiáveis, incluindo:
- Notícias do BNO
- Centros de Controle e Prevenção de Doenças (CDC)
- Departamentos de saúde pública nacionais/regionais e estaduais
- Wikipédia
- A Organização Mundial da Saúde (OMS)
- 24/7 Wall St.
Observação
A Microsoft fornece o Azure Open Datasets no estado em que se encontra. A Microsoft não oferece garantias nem coberturas, expressas ou implícitas, em relação ao uso dos conjuntos de dados. Até o limite permitido pela legislação local, a Microsoft se exime de toda a obrigação por danos ou perdas, inclusive diretos, consequentes, especiais, indiretos, acidentais ou punitivos, resultantes do uso dos conjuntos de dados.
Esse conjunto de dados é fornecido de acordo com os termos originais com que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados originados da Microsoft.
Conjunto de dados
Os conjuntos de dados de COVID-19 modificados estão disponíveis em CSV, JSON, JSON-Lines e Parquet:
Todos os conjuntos de dados modificados têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados. Eles usam nomes de coluna de minúsculas com separadores de sublinhado.
Versões anteriores de dados modificados e brutos estão disponíveis neste recurso.
Volume de dados
Todos os conjuntos de dados recebem atualizações diárias. A partir de 05 de março de 2023, continham 4.766.737 linhas. O conjunto de dados está disponível nestes formatos de arquivo:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Atribuição de licença e direitos de uso
Os dados estão disponíveis estritamente para fins educacionais e acadêmicos sob esses termos e condições. As finalidades válidas incluem:
- instituições acadêmicas
- agências governamentais
- investigação médica
Os dados usados ou citados em publicações devem incluir uma atribuição para o "Rastreador de COVID-19 do Bing" com um link para www.bing.com/covid.
Contato
Para dúvidas ou comentários sobre este ou outros conjuntos de dados no Data Lake COVID-19, entre em contato com askcovid19dl@microsoft.com.
Colunas
Nome | Tipo de dados | Exclusivo | Valores (exemplo) | Descrição |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Região em country_region |
admin_region_2 | string | 3.143 | Condado de Jefferson do Condado de Washington | Região em admin_region_1 |
confirmado | INT | 120.692 | 1 2 | Contagem dos casos confirmados na região |
confirmed_change | INT | 12.120 | 1 2 | Alteração na contagem de casos confirmados do dia anterior |
country_region | string | 237 | Estados Unidos Índia | País/Região |
mortes | INT | 20.616 | 1 2 | Contagem dos casos de mortes por região |
deaths_change | SMALLINT | 1\.981 | 1 2 | Alteração na contagem de mortes do dia anterior |
id | INT | 1\.783.534 | 742546 69019298 | Identificador exclusivo |
iso_subdivision | string | 484 | US-TX US-GA | Código de subdivisão ISO de duas partes |
iso2 | string | 226 | US IN | Identificador de código do país de duas letras |
iso3 | string | 226 | USA IND | Identificador de código do país de três letras |
latitude | double | 5\.675 | 42.28708 19.59852 | Latitude do centroide da região |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | A data e hora em que o arquivo foi carregado da origem do Bing no GitHub |
longitude | double | 5\.693 | -2.5396 -155.5186 | Longitude do centroide da região |
recuperados | INT | 73.287 | 1 2 | Contagem dos recuperados na região |
recovered_change | INT | 10.441 | 1 2 | Alteração na contagem de casos recuperados do dia anterior |
atualizado | date | 457 | 2021-04-23 2021-04-22 | A data no momento do registro |
Versão Prévia
id | atualizado | confirmado | mortes | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 21/01/2020 | 262 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | ||
338996 | 22/01/2020 | 313 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 51 | 0 |
338997 | 23/01/2020 | 578 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 265 | 0 |
338998 | 24/01/2020 | 841 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 263 | 0 |
338999 | 25/01/2020 | 1320 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 479 | 0 |
339000 | 26/01/2020 | 2014 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 694 | 0 |
339001 | 27/01/2020 | 2798 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 784 | 0 |
339002 | 28/01/2020 | 4593 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 1795 | 0 |
339003 | 29/01/2020 | 6065 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 1.472 | 0 |
339004 | 30/01/2020 | 7818 | 0 | nulo | nulo | No mundo inteiro | nulo | nulo | nulo | 26/04/2021 00:06:34 | 1753 | 0 |
Acesso a dados – Azure Notebooks
Observação
Este notebook documenta as URLs e o código de exemplo para acessar conjunto de dados de COVID-19 do Bing.
Use as seguintes URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:
Baixe o arquivo do conjunto de arquivos usando o download de recurso interno de uma URL HTTP no Pandas. O Pandas tem leitores para vários formatos de arquivo:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Para verificar se a coluna atualizada tem formato de data e hora, verifique os tipos de dados dos vários campos:
df.dtypes
Examine os dados em todo o mundo. Para visualizar os dados, crie alguns gráficos:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Acesso a dados – Azure Databricks
Amostra não disponível para essa combinação de plataforma/pacote.
Acesso a dados – Azure Synapse
Amostra não disponível para essa combinação de plataforma/pacote.
Próximas etapas
Exiba o restante dos conjuntos de dados no catálogo do Open Datasets.