Partilhar via


Bing COVID-19

Os dados COVID-19 do Bing incluem casos confirmados, fatais e recuperados de todas as regiões, que são atualizados diariamente. O Bing COVID-19 Tracker reflete esses dados.

O Bing recolhe dados de várias fontes fidedignas e fiáveis, incluindo:

Nota

A Microsoft fornece os Conjuntos de Dados Abertos do Azure "no estado em que se encontram". A Microsoft não oferece garantias, expressas ou implícitas, garantias ou condições em relação ao seu uso dos conjuntos de dados. Na medida permitida pela legislação local, a Microsoft se isenta de qualquer responsabilidade por quaisquer danos ou perdas, incluindo diretos, consequenciais, especiais, indiretos, incidentais ou punitivos, resultantes do uso dos conjuntos de dados por parte do cliente.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Conjuntos de Dados

Os conjuntos de dados modificados do Bing COVID-19 estão disponíveis em CSV, JSON, JSON-Lines e Parquet:

Todos os conjuntos de dados modificados têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados. Eles usam nomes de colunas minúsculas com separadores de sublinhado.

Dados brutos no formato CSV

Versões anteriores de dados modificados e brutos estão disponíveis neste recurso.

Volume de dados

Todos os conjuntos de dados recebem atualizações diárias. Em 5 de março de 2023, continham 4.766.737 linhas. O conjunto de dados está disponível nestes formatos de ficheiro:

  • CSV (560,3 MB)
  • JSON (1515,6 MB)
  • JSONL (1506,2 MB)
  • Parquet (55,4 MB)

Atribuição de licenças e direitos de utilização

Os dados estão disponíveis estritamente para fins educacionais e acadêmicos sob estes termos e condições. As finalidades válidas incluem:

  • instituições académicas
  • agências governamentais
  • Investigação médica

Os dados usados ou citados em publicações devem incluir uma atribuição ao 'Bing COVID-19 Tracker', com um link para www.bing.com/covid.

Contacto

Para qualquer dúvida ou feedback sobre este ou outros conjuntos de dados no COVID-19 Data Lake, entre em contato com askcovid19dl@microsoft.com.

Colunas

Name Tipo de dados Exclusivo Values (sample) Description
admin_region_1 string 864 Texas Geórgia Região em country_region
admin_region_2 string 3143 Condado de Washington Condado de Jefferson Região em admin_region_1
confirmado número inteiro 120,692 1 2 Número de casos confirmados da região
confirmed_change número inteiro 12,120 1 2 Alteração do número de casos confirmados do dia anterior
country_region string 237 Estados Unidos Índia País/Região
Óbitos número inteiro 20,616 1 2 Número de casos de morte da região
deaths_change smallint 1,981 1 2 Alteração do número de mortes do dia anterior
id número inteiro 1,783,534 742546 69019298 Identificador exclusivo
iso_subdivision string 484 EUA-TX EUA-GA Código de subdivisão ISO em duas partes
ISO2 string 226 EUA EM Identificador do código do país de 2 letras
ISO3 string 226 EUA IND Identificador do código do país de 3 letras
latitude duplo 5,675 42.28708 19.59852 Latitude do centroide da região
load_time carimbo de data/hora 1 2021-04-26 00:06:34.719000 A data e a hora de carregamento do ficheiro da origem do Bing no GitHub
longitude duplo 5,693 -2.5396 -155.5186 Longitude do centroide da região
recuperados número inteiro 73,287 1 2 Número de casos recuperados da região
recovered_change número inteiro 10,441 1 2 Alteração do número de casos recuperados do dia anterior
atualizado data 457 2021-04-23 2021-04-22 A data do registo

Pré-visualizar

id atualizado confirmado Óbitos ISO2 ISO3 country_region admin_region_1 iso_subdivision admin_region_2 load_time confirmed_change deaths_change
338995 2020-01-21 262 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34
338996 2020-01-22 313 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 51 0
338997 2020-01-23 578 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 265 0
338998 2020-01-24 841 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 263 0
338999 2020-01-25 1320 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 479 0
339000 2020-01-26 2014 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 694 0
339001 2020-01-27 2798 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 784 0
339002 2020-01-28 4593 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 1795 0
339003 2020-01-29 6065 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 1472 0
339004 2020-01-30 7818 0 nulo nulo Mundial nulo nulo nulo 26/04/2021 12:06:34 1753 0

Acesso a dados - Azure Notebooks

Nota

Este bloco de notas documenta os URLs e o código de exemplo para aceder ao Conjunto de Dados do Bing COVID-19.

Use estas URLs para obter formatos de arquivo específicos hospedados no Armazenamento de Blobs do Azure:

Transfira o ficheiro do conjunto de dados utilizando a capacidade incorporada do Pandas para transferir a partir de um URL HTTP. Pandas tem leitores para vários formatos de arquivo:

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Para verificar se a coluna atualizada tem um formato datetime, verifique os tipos de dados dos vários campos:

df.dtypes

Analise os dados mundiais. Para visualizar os dados, construa alguns gráficos:

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Acesso a dados - Azure Databricks

Uma amostra não está disponível para esta combinação de plataforma/pacote.

Acesso a dados - Azure Synapse

Uma amostra não está disponível para esta combinação de plataforma/pacote.

Próximos passos

Exiba o restante dos conjuntos de dados no catálogo Open Datasets.