Projeto de Controlo COVID

O conjunto de dados COVID Tracking Project fornece os mais recentes números relativos a testes, casos confirmados, internamentos e resultados dos pacientes provenientes de cada estado e território dos EUA.

Para obter mais informações sobre este conjunto de dados, veja o repositório do GitHub do projeto.

Nota

A Microsoft fornece o Azure Open Datasets "tal como está". A Microsoft não concede garantias, expressas ou implícitas, nem condições relativamente à sua utilização dos conjuntos de dados. Até ao limite permitido pela sua legislação local, a Microsoft declina toda a responsabilidade por quaisquer danos ou perdas, incluindo danos diretos, consequentes, especiais, indiretos, incidentais ou punitivos, resultantes da utilização dos conjuntos de dados.

Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.

Conjuntos de dados

As versões modificadas do conjunto de dados estão disponíveis nos formatos CSV, JSON, JSON-Lines e Parquet.

Todas as versões modificadas têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados, além de que utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.

Dados não processados: "https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json"

Versões anteriores de dados não processados e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Volume de dados

Todos os conjuntos de dados são atualizados diariamente. Desde 13 de maio de 2020, contêm 4100 linhas (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).

Origem de dados

Estes dados foram publicados originalmente pelo COVID Tracking Project na revista Atlantic. Os dados não processados são ingeridos a partir do repositório do GitHub coVID Tracking com o ficheirostates_daily_4p_et.csv. Para obter mais informações sobre este conjunto de dados, incluindo as origens da API do Projeto de Controlo da COVID, veja o repositório do GitHub do projeto.

Qualidade de dados

O CoVID Tracking Project classifica a qualidade dos dados para cada estado e fornece mais informações sobre a avaliação da qualidade dos dados. Para obter mais informações, veja a página dados do CoVID Tracking Project. Os dados no repositório do GitHub podem ter um atraso de uma hora em relação à API; a utilização da API é necessária para aceder aos dados mais recentes.

Atribuição de direitos de licença e utilização

Estes dados são licenciados nos termos e condições da Licença Apache 2.0.

Qualquer utilização dos dados deve reter todos os avisos de direitos de autor, patentes, marcas registadas e atribuição.

Contacto

Para quaisquer perguntas ou comentários sobre este ou outros conjuntos de dados no CoVID-19 Data Lake, contacte askcovid19dl@microsoft.com.

Colunas

Name Tipo de dados Exclusivo Valores (exemplo) Description
data data 420 2020-11-10 2021-01-30 Data na qual os totais diários foram recolhidos.
date_checked string 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Preterido
morte smallint 7,327 2 5 Número total de pessoas que morreram devido à COVID-19 até agora.
death_increase smallint 429 1 2 Preterido
fíps smallint 56 26 55 Código de censos FIPS do estado.
fips_code string 60 53 25 Código de censos FIPS do estado.
hash string 20,780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Um hash para este registo
hospitalizado int 7,641 89995 4 Preterido
hospitalized_cumulative int 7,641 89995 4 Número total de pessoas que se deslocaram ao hospital por COVID-19 até agora, incluindo os que recuperaram ou morreram desde então.
hospitalized_currently smallint 3,886 8 13 Número de pessoas hospitalizadas por COVID-19 neste dia.
hospitalized_increase smallint 615 1 2 Preterido
in_icu_cumulative smallint 2,295 990 220 Número total de pessoas internadas nas UCI por COVID-19 até agora, incluindo os que recuperaram ou morreram desde então.
in_icu_currently smallint 1,643 2 8 Número total de pessoas nas UCI por COVID-19 neste dia.
iso_country string 1 EUA Código ISO 3166 do país ou região
iso_subdivision string 57 US-UM US-WA Código ISO 3166 de subdivisão
last_update_et carimbo de data/hora 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 Última vez que os dados do dia foram atualizados
load_time carimbo de data/hora 1 2021-04-26 00:06:49.883000 Data e hora em que os dados foram carregados para o Azure a partir da origem
negativo int 10,864 305972 2140 Número total de pessoas que testaram negativo à COVID-19 até agora.
negative_increase int 7,328 6 17 Preterido
on_ventilator_cumulative smallint 677 411 412 Número total de pessoas que tiveram de ser ventiladas para tratar a COVID-19 até agora, incluindo as que recuperaram ou morreram desde então.
on_ventilator_currently smallint 837 4 10 Número de pessoas que estão ligadas a ventilador para tratar a COVID-19 neste dia.
pendente smallint 944 2 17 Número de testes cujos resultados ainda não foram determinados.
pos_neg int 18,282 2140 2 Preterido
positivo int 16,837 2 1 Número total de pessoas que testaram positivo à COVID-19 até agora.
positive_increase smallint 4,754 1 2 Preterido
recuperado int 8,286 29 19 Número total de pessoas que recuperaram da COVID-19 até agora.
state string 56 MI PA Código de duas letras do estado.
total int 18,283 2140 2 Preterido
total_test_results int 18,648 2140 3 Total de resultados de testes disponibilizados pelo estado
total_test_results_increase int 13,463 1 2 Preterido

Pré-visualizar

data state positivo hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et hash date_checked morte hospitalizado total total_test_results pos_neg fíps death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negativo in_icu_cumulative on_ventilator_cumulative recuperado in_icu_currently
2021-03-07 AK 56886 33 1293 2 nulo 05/03/2021 3:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 05/03/2021 3:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 26/04/2021 12:06:49 EUA
2021-03-07 AL 499819 494 45976 nulo 07/03/2021 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 07/03/2021 11:00:00 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 26/04/2021 12:06:49 EUA 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 nulo 07/03/2021 00:00 50921aeefba3e30d31623aa495b47fb2ecc72fae 07/03/2021 00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 26/04/2021 12:06:49 EUA 2480716 1533 315517 141
2021-03-07 AS 0 nulo 01/12/2020 00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 01/12/2020 00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 26/04/2021 12:06:49 EUA 2140
2021-03-07 AZ 826454 963 57907 143 nulo 07/03/2021 00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 07/03/2021 00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 26/04/2021 12:06:49 EUA 3073010 273
2021-03-07 CA 3501394 4291 nulo 07/03/2021 2:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 07/03/2021 2:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 26/04/2021 12:06:49 EUA 1159
2021-03-07 CO 436602 326 23904 nulo 07/03/2021 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 07/03/2021 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 26/04/2021 12:06:49 EUA 2199458
2021-03-07 CT 285330 428 12257 nulo 4/03/2021 23:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 4/03/2021 23:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 26/04/2021 00:06:49 EUA
2021-03-07 DC 41419 150 16 nulo 06/03/2021 00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 06/03/2021 00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 26/04/2021 00:06:49 EUA 29570 38
2021-03-07 DE 88354 104 nulo 06/03/2021 18:00 059d870e689d5cc19c35f5eb398214d7d9856373 06/03/2021 18:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 26/04/2021 00:06:49 EUA 545070 13

Acesso a dados

Azure Notebooks

URLs de diferentes formatos de ficheiro de conjuntos de dados alojados no Armazenamento de Blobs do Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Transfira o ficheiro do conjunto de dados com a transferência de capacidade incorporada a partir de um URL http no Pandas. O Pandas tem leitores para vários formatos de ficheiro:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Exemplo não disponível para esta combinação de plataforma/pacote.

Azure Synapse

Exemplo não disponível para esta combinação de plataforma/pacote.

Passos seguintes

Veja o resto dos conjuntos de dados no catálogo Abrir Conjuntos de Dados.