Projeto de Controlo COVID
O conjunto de dados COVID Tracking Project fornece os mais recentes números relativos a testes, casos confirmados, internamentos e resultados dos pacientes provenientes de cada estado e território dos EUA.
Para obter mais informações sobre este conjunto de dados, veja o repositório do GitHub do projeto.
Nota
A Microsoft fornece o Azure Open Datasets "tal como está". A Microsoft não concede garantias, expressas ou implícitas, nem condições relativamente à sua utilização dos conjuntos de dados. Até ao limite permitido pela sua legislação local, a Microsoft declina toda a responsabilidade por quaisquer danos ou perdas, incluindo danos diretos, consequentes, especiais, indiretos, incidentais ou punitivos, resultantes da utilização dos conjuntos de dados.
Este conjunto de dados é disponibilizado de acordo com os termos originais em que a Microsoft recebeu os dados de origem. O conjunto de dados pode incluir dados obtidos junto da Microsoft.
Conjuntos de dados
As versões modificadas do conjunto de dados estão disponíveis nos formatos CSV, JSON, JSON-Lines e Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Todas as versões modificadas têm códigos de subdivisão ISO 3166 e tempos de carregamento adicionados, além de que utilizam nomes de colunas em minúsculas com separadores de caráter de sublinhado.
Dados não processados: "https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json"
Versões anteriores de dados não processados e modificados: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Volume de dados
Todos os conjuntos de dados são atualizados diariamente. Desde 13 de maio de 2020, contêm 4100 linhas (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).
Origem de dados
Estes dados foram publicados originalmente pelo COVID Tracking Project na revista Atlantic. Os dados não processados são ingeridos a partir do repositório do GitHub coVID Tracking com o ficheirostates_daily_4p_et.csv. Para obter mais informações sobre este conjunto de dados, incluindo as origens da API do Projeto de Controlo da COVID, veja o repositório do GitHub do projeto.
Qualidade de dados
O CoVID Tracking Project classifica a qualidade dos dados para cada estado e fornece mais informações sobre a avaliação da qualidade dos dados. Para obter mais informações, veja a página dados do CoVID Tracking Project. Os dados no repositório do GitHub podem ter um atraso de uma hora em relação à API; a utilização da API é necessária para aceder aos dados mais recentes.
Atribuição de direitos de licença e utilização
Estes dados são licenciados nos termos e condições da Licença Apache 2.0.
Qualquer utilização dos dados deve reter todos os avisos de direitos de autor, patentes, marcas registadas e atribuição.
Contacto
Para quaisquer perguntas ou comentários sobre este ou outros conjuntos de dados no CoVID-19 Data Lake, contacte askcovid19dl@microsoft.com.
Colunas
Name | Tipo de dados | Exclusivo | Valores (exemplo) | Description |
---|---|---|---|---|
data | data | 420 | 2020-11-10 2021-01-30 | Data na qual os totais diários foram recolhidos. |
date_checked | string | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Preterido |
morte | smallint | 7,327 | 2 5 | Número total de pessoas que morreram devido à COVID-19 até agora. |
death_increase | smallint | 429 | 1 2 | Preterido |
fíps | smallint | 56 | 26 55 | Código de censos FIPS do estado. |
fips_code | string | 60 | 53 25 | Código de censos FIPS do estado. |
hash | string | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Um hash para este registo |
hospitalizado | int | 7,641 | 89995 4 | Preterido |
hospitalized_cumulative | int | 7,641 | 89995 4 | Número total de pessoas que se deslocaram ao hospital por COVID-19 até agora, incluindo os que recuperaram ou morreram desde então. |
hospitalized_currently | smallint | 3,886 | 8 13 | Número de pessoas hospitalizadas por COVID-19 neste dia. |
hospitalized_increase | smallint | 615 | 1 2 | Preterido |
in_icu_cumulative | smallint | 2,295 | 990 220 | Número total de pessoas internadas nas UCI por COVID-19 até agora, incluindo os que recuperaram ou morreram desde então. |
in_icu_currently | smallint | 1,643 | 2 8 | Número total de pessoas nas UCI por COVID-19 neste dia. |
iso_country | string | 1 | EUA | Código ISO 3166 do país ou região |
iso_subdivision | string | 57 | US-UM US-WA | Código ISO 3166 de subdivisão |
last_update_et | carimbo de data/hora | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | Última vez que os dados do dia foram atualizados |
load_time | carimbo de data/hora | 1 | 2021-04-26 00:06:49.883000 | Data e hora em que os dados foram carregados para o Azure a partir da origem |
negativo | int | 10,864 | 305972 2140 | Número total de pessoas que testaram negativo à COVID-19 até agora. |
negative_increase | int | 7,328 | 6 17 | Preterido |
on_ventilator_cumulative | smallint | 677 | 411 412 | Número total de pessoas que tiveram de ser ventiladas para tratar a COVID-19 até agora, incluindo as que recuperaram ou morreram desde então. |
on_ventilator_currently | smallint | 837 | 4 10 | Número de pessoas que estão ligadas a ventilador para tratar a COVID-19 neste dia. |
pendente | smallint | 944 | 2 17 | Número de testes cujos resultados ainda não foram determinados. |
pos_neg | int | 18,282 | 2140 2 | Preterido |
positivo | int | 16,837 | 2 1 | Número total de pessoas que testaram positivo à COVID-19 até agora. |
positive_increase | smallint | 4,754 | 1 2 | Preterido |
recuperado | int | 8,286 | 29 19 | Número total de pessoas que recuperaram da COVID-19 até agora. |
state | string | 56 | MI PA | Código de duas letras do estado. |
total | int | 18,283 | 2140 2 | Preterido |
total_test_results | int | 18,648 | 2140 3 | Total de resultados de testes disponibilizados pelo estado |
total_test_results_increase | int | 13,463 | 1 2 | Preterido |
Pré-visualizar
data | state | positivo | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | morte | hospitalizado | total | total_test_results | pos_neg | fíps | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negativo | in_icu_cumulative | on_ventilator_cumulative | recuperado | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | nulo | 05/03/2021 3:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 05/03/2021 3:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26/04/2021 12:06:49 | EUA | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | nulo | 07/03/2021 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 07/03/2021 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 26/04/2021 12:06:49 | EUA | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | nulo | 07/03/2021 00:00 | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 07/03/2021 00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26/04/2021 12:06:49 | EUA | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | nulo | 01/12/2020 00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 01/12/2020 00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 26/04/2021 12:06:49 | EUA | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | nulo | 07/03/2021 00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 07/03/2021 00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 26/04/2021 12:06:49 | EUA | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | nulo | 07/03/2021 2:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 07/03/2021 2:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 26/04/2021 12:06:49 | EUA | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | nulo | 07/03/2021 1:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 07/03/2021 1:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26/04/2021 12:06:49 | EUA | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | nulo | 4/03/2021 23:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 4/03/2021 23:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26/04/2021 00:06:49 | EUA | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | nulo | 06/03/2021 00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 06/03/2021 00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26/04/2021 00:06:49 | EUA | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | nulo | 06/03/2021 18:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 06/03/2021 18:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 26/04/2021 00:06:49 | EUA | 545070 | 13 |
Acesso a dados
Azure Notebooks
URLs de diferentes formatos de ficheiro de conjuntos de dados alojados no Armazenamento de Blobs do Azure:
Transfira o ficheiro do conjunto de dados com a transferência de capacidade incorporada a partir de um URL http no Pandas. O Pandas tem leitores para vários formatos de ficheiro:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Exemplo não disponível para esta combinação de plataforma/pacote.
Azure Synapse
Exemplo não disponível para esta combinação de plataforma/pacote.
Passos seguintes
Veja o resto dos conjuntos de dados no catálogo Abrir Conjuntos de Dados.