COVID-traceringsproject
De COVID Tracking Project-gegevensset levert de laatste aantallen tests, bevestigde gevallen, ziekenhuisopnamen en patiƫntresultaten van alle Amerikaanse staten en territoriums.
Zie de GitHub-opslagplaats van het project voor meer informatie over deze gegevensset.
Notitie
Microsoft biedt Azure Open Datasets op een 'as is'-basis. Microsoft biedt geen garanties, expliciet of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover is toegestaan op grond van uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor schade of verliezen, met inbegrip van directe schade, gevolgschade, speciale, indirecte, incidentele of bestraffende schade als gevolg van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevenssets
Gewijzigde versies van de gegevensset zijn beschikbaar als CSV, JSON, JSON-Lines en Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Aan alle gewijzigde versies zijn ISO 3166-onderverdelingscodes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.
Onbewerkte gegevens: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Gegevensvolume
Alle gegevenssets worden dagelijks bijgewerkt. Vanaf 13 mei 2020 bevatten de gegevenssets 4100 rijen (CSV 574 kB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).
Gegevensbron
Deze gegevens zijn oorspronkelijk gepubliceerd door het COVID Tracking Project at the Atlantic. Onbewerkte gegevens worden opgenomen uit de GitHub-opslagplaats covid-tracering met behulp van het states_daily_4p_et.csv-bestand. Zie de GitHub-opslagplaats van het project voor meer informatie over deze gegevensset, inclusief de oorsprong van de PROJECT-API voor covid-tracering.
Gegevenskwaliteit
Covid Tracking Project beoordeelt de gegevenskwaliteit voor elke status en biedt meer informatie over hun beoordeling van de kwaliteit van de gegevens. Zie de pagina met gegevens van het COVID-traceringsproject voor meer informatie. Gegevens in de GitHub-opslagplaats kunnen een uur achterlopen op de API; gebruik van de API is nodig om toegang te krijgen tot de meest recente gegevens.
Licentie- en gebruiksrechten toewijzen
Deze gegevens worden gelicentieerd onder de voorwaarden van de Apache-licentie 2.0.
Elk gebruik van de gegevens moet alle kennisgevingen over auteursrechten, octrooien, handelsmerken en toeschrijvingen behouden.
Contactpersoon
Voor vragen of feedback over deze of andere gegevenssets in de COVID-19 Data Lake, neemt u contact op met askcovid19dl@microsoft.com.
Kolommen
Naam | Gegevenstype | Uniek | Waarden (voorbeeld) | Description |
---|---|---|---|---|
datum | datum | 420 | 2020-11-10 2021-01-30 | Datum waarvoor de dagtotalen zijn verzameld. |
date_checked | tekenreeks | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Afgeschaft |
Dood | smallint | 7,327 | 2 5 | Totaalaantal personen dat tot dusverre aan COVID-19 is overleden. |
death_increase | smallint | 429 | 1 2 | Afgeschaft |
Fips | smallint | 56 | 26 55 | FIPS-code volkstelling voor de staat. |
fips_code | tekenreeks | 60 | 53 25 | FIPS-code volkstelling voor de staat. |
hash | tekenreeks | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Een hash voor deze record |
Ziekenhuis | int | 7,641 | 89995 4 | Afgeschaft |
hospitalized_cumulative | int | 7,641 | 89995 4 | Totaalaantal personen dat tot dusverre in het ziekenhuis werd opgenomen in verband met COVID-19, inclusief personen die sindsdien zijn hersteld of overleden. |
hospitalized_currently | smallint | 3,886 | 8 13 | Aantal personen in een ziekenhuis voor COVID-19 op deze dag. |
hospitalized_increase | smallint | 615 | 1 2 | Afgeschaft |
in_icu_cumulative | smallint | 2,295 | 990 220 | Totaalaantal personen dat tot dusverre op de intensivecareafdeling werd opgenomen in verband met COVID-19, inclusief personen die sindsdien zijn hersteld of overleden. |
in_icu_currently | smallint | 1,643 | 2 8 | Totaalaantal personen op een IC-afdeling voor COVID-19 op deze dag. |
iso_country | tekenreeks | 1 | VS | ISO 3166-land- of regiocode |
iso_subdivision | tekenreeks | 57 | US-UM US-WA | ISO 3166-onderverdelingscode |
last_update_et | tijdstempel | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | De laatste keer dat de gegevens van de dag zijn bijgewerkt |
load_time | tijdstempel | 1 | 2021-04-26 00:06:49.883000 | Datum en tijd waarop de gegevens vanuit de bron in Azure zijn geladen |
negatief | int | 10,864 | 305972 2140 | Totaalaantal personen dat tot dusverre negatief is getest op COVID-19. |
negative_increase | int | 7,328 | 6 17 | Afgeschaft |
on_ventilator_cumulative | smallint | 677 | 411 412 | Totaalaantal personen dat tot dusverre in verband met COVID-19 aan een beademingsapparaat heeft gelegen, inclusief personen die zijn hersteld of overleden. |
on_ventilator_currently | smallint | 837 | 4 10 | Aantal personen dat op deze dag in verband met COVID-19 aan een beademingsapparaat ligt. |
in behandeling | smallint | 944 | 2 17 | Aantal tests waarvan de resultaten nog moeten worden vastgesteld. |
pos_neg | int | 18,282 | 2140 2 | Afgeschaft |
positief | int | 16,837 | 2 1 | Totaalaantal personen dat tot dusverre positief is getest op COVID-19. |
positive_increase | smallint | 4,754 | 1 2 | Afgeschaft |
Hersteld | int | 8,286 | 29 19 | Totaalaantal personen dat tot dusverre van COVID-19 is hersteld. |
staat | tekenreeks | 56 | MI PA | Code van twee letters voor de staat. |
totaal | int | 18,283 | 2140 2 | Afgeschaft |
total_test_results | int | 18,648 | 2140 3 | Totaalaantal testresultaten dat door de staat is aangeleverd |
total_test_results_increase | int | 13,463 | 1 2 | Afgeschaft |
Preview
datum | staat | positief | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hash | date_checked | Dood | Ziekenhuis | totaal | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negatief | in_icu_cumulative | on_ventilator_cumulative | Hersteld | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 05-3-2021 3:59:00 uur | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 05-3-2021 3:59:00 uur | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26-4-2021 00:06:49 uur | VS | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | null | 7-3-2021 11:00:00 uur | 997207b430824ea40b8eb8506c19a93e07bc972e | 7-3-2021 11:00:00 uur | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 26-4-2021 00:06:49 uur | VS | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | null | 7-3-2021 00:00 uur | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 7-3-2021 00:00 uur | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26-4-2021 00:06:49 uur | VS | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 12-12-2020 0:00:00 uur | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 12-12-2020 0:00:00 uur | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 26-4-2021 12:06:49 uur | VS | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | null | 7-3-2021 0:00:00 uur | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 7-3-2021 0:00:00 uur | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 26-4-2021 12:06:49 uur | VS | 3073010 | 273 | |||
2021-03-07 | CA (consistentie en beschikbaarheid) | 3501394 | 4291 | null | 7-3-2021 2:59:00 uur | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 7-3-2021 2:59:00 uur | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 26-4-2021 12:06:49 uur | VS | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | null | 7-3-2021 1:59:00 uur | 444746cda3a596f183f3fa3269c8cab68704e819 | 7-3-2021 1:59:00 uur | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26-4-2021 12:06:49 uur | VS | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | null | 4-3-2021 23:59:00 uur | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 4-3-2021 23:59:00 uur | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26-4-2021 00:06:49 uur | VS | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | null | 6-3-2021 00:00 uur | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 6-3-2021 00:00 uur | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26-4-2021 00:06:49 uur | VS | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | null | 6-3-2021 18:00:00 uur | 059d870e689d5cc19c35f5eb398214d7d9856373 | 6-3-2021 18:00:00 uur | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 26-4-2021 00:06:49 uur | VS | 545070 | 13 |
Toegang tot gegevens
Azure Notebooks
URL's van verschillende bestandsindelingen voor gegevenssets die worden gehost op Azure Blob Storage:
Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid om te downloaden vanaf een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Voorbeeld niet beschikbaar voor deze platform-/pakketcombinatie.
Azure Synapse
Voorbeeld niet beschikbaar voor deze platform-/pakketcombinatie.
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.