Bing COVID-19
Os dados COVID-19 do Bing incluem casos confirmados, fatais e recuperados de todas as regiões, que são atualizados diariamente. O Bing COVID-19 Tracker reflete esses dados.
O Bing recolhe dados de várias fontes fidedignas e fiáveis, incluindo:
- Notícias BNO
- Centros de Controle e Prevenção de Doenças (CDC)
- Departamentos de saúde pública nacionais/regionais e estaduais
- Wikipédia
- Organização Mundial da Saúde (OMS)
- 24/7 Wall St.
Nota
A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.
Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.
Conjuntos de Dados
Os conjuntos de dados modificados do Bing COVID-19 estão disponíveis em CSV, JSON, JSON-Lines e Parquet:
Todos os conjuntos de dados modificados têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados. Eles usam nomes de colunas minúsculas com separadores de sublinhado.
Versões anteriores de dados modificados e brutos estão disponíveis neste recurso.
Volume de dados
Todos os conjuntos de dados recebem atualizações diárias. Em 5 de março de 2023, continham 4.766.737 linhas. O conjunto de dados está disponível nestes formatos de ficheiro:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Atribuição de licenças e direitos de utilização
Os dados estão disponíveis estritamente para fins educacionais e acadêmicos sob estes termos e condições. As finalidades válidas incluem:
- instituições académicas
- agências governamentais
- Investigação médica
Os dados usados ou citados em publicações devem incluir uma atribuição ao 'Bing COVID-19 Tracker', com um link para www.bing.com/covid.
Contacto
Para qualquer dúvida ou feedback sobre este ou outros conjuntos de dados no COVID-19 Data Lake, entre em contato com askcovid19dl@microsoft.com.
Colunas
Name | Tipo de dados | Exclusivo | Values (sample) | Description |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Geórgia | Região em country_region |
admin_region_2 | string | 3143 | Condado de Washington Condado de Jefferson | Região em admin_region_1 |
confirmado | número inteiro | 120,692 | 1 2 | Número de casos confirmados da região |
confirmed_change | número inteiro | 12,120 | 1 2 | Alteração do número de casos confirmados do dia anterior |
country_region | string | 237 | Estados Unidos Índia | País/Região |
Óbitos | número inteiro | 20,616 | 1 2 | Número de casos de morte da região |
deaths_change | smallint | 1,981 | 1 2 | Alteração do número de mortes do dia anterior |
id | número inteiro | 1,783,534 | 742546 69019298 | Identificador exclusivo |
iso_subdivision | string | 484 | EUA-TX EUA-GA | Código de subdivisão ISO em duas partes |
ISO2 | string | 226 | EUA EM | Identificador do código do país de 2 letras |
ISO3 | string | 226 | EUA IND | Identificador do código do país de 3 letras |
latitude | duplo | 5,675 | 42.28708 19.59852 | Latitude do centroide da região |
load_time | carimbo de data/hora | 1 | 2021-04-26 00:06:34.719000 | A data e a hora de carregamento do ficheiro da origem do Bing no GitHub |
longitude | duplo | 5,693 | -2.5396 -155.5186 | Longitude do centroide da região |
recuperados | número inteiro | 73,287 | 1 2 | Número de casos recuperados da região |
recovered_change | número inteiro | 10,441 | 1 2 | Alteração do número de casos recuperados do dia anterior |
atualizado | data | 457 | 2021-04-23 2021-04-22 | A data do registo |
Pré-visualizar
id | atualizado | confirmado | Óbitos | ISO2 | ISO3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | nulo | nulo | Mundial | nulo | nulo | nulo | 26/04/2021 12:06:34 | 1753 | 0 |
Acesso a dados - Azure Notebooks
Nota
Este bloco de notas documenta os URLs e o código de exemplo para aceder ao Conjunto de Dados do Bing COVID-19.
Use estas URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:
Transfira o ficheiro do conjunto de dados utilizando a capacidade incorporada do Pandas para transferir a partir de um URL HTTP. Pandas tem leitores para vários formatos de arquivo:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Para verificar se a coluna atualizada tem um formato datetime, verifique os tipos de dados dos vários campos:
df.dtypes
Analise os dados mundiais. Para visualizar os dados, construa alguns gráficos:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Acesso a dados - Azure Databricks
Uma amostra não está disponível para esta combinação de plataforma/pacote.
Acesso a dados - Azure Synapse
Uma amostra não está disponível para esta combinação de plataforma/pacote.
Próximos passos
Exiba o restante dos conjuntos de dados no catálogo Open Datasets.