COVID-traceringsproject
De COVID Tracking Project-gegevensset levert de laatste aantallen tests, bevestigde gevallen, ziekenhuisopnamen en patiƫntresultaten van alle Amerikaanse staten en territoriums.
Zie de GitHub-opslagplaats van het project voor meer informatie over deze gegevensset.
Notitie
Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.
Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.
Gegevenssets
Gewijzigde versies van de gegevensset zijn beschikbaar als CSV, JSON, JSON-Lines en Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Aan alle gewijzigde versies zijn ISO 3166-onderverdelingscodes en laadtijden toegevoegd. Ook worden voor de gegevenssets kolomnamen in kleine letters gescheiden door onderstrepingstekens gebruikt.
Onbewerkte gegevens: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
Vorige versies van gewijzigde en onbewerkte gegevens: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Gegevensvolume
Alle gegevenssets worden dagelijks bijgewerkt. Vanaf 13 mei 2020 bevatten de gegevenssets 4100 rijen (CSV 574 kB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).
Gegevensbron
Deze gegevens zijn oorspronkelijk gepubliceerd door het COVID Tracking Project at the Atlantic. Onbewerkte gegevens worden opgenomen uit de GitHub-opslagplaats voor COVID Tracking met behulp van het states_daily_4p_et.csv-bestand. Zie de GitHub-opslagplaats van het project voor meer informatie over deze gegevensset, inclusief de oorsprong van de COVID Tracking Project-API.
Gegevenskwaliteit
COVID Tracking Project beoordeelt de gegevenskwaliteit voor elke status en biedt meer informatie over hun beoordeling van de kwaliteit van de gegevens. Zie de gegevenspagina van het COVID Tracking Project voor meer informatie. Gegevens in de GitHub-opslagplaats kunnen een uur achterlopen op de API; gebruik van de API is nodig om toegang te krijgen tot de meest recente gegevens.
Licentie- en gebruiksrechten toewijzen
Deze gegevens worden gelicentieerd onder de voorwaarden van de Apache License 2.0.
Elk gebruik van de gegevens moet alle copyright-, patent-, handelsmerk- en toeschrijvingsaanduidingen behouden.
Contactpersoon
Neem voor vragen of feedback over deze of andere gegevenssets in covid-19 Data Lake contact op askcovid19dl@microsoft.com.
Kolommen
Naam | Gegevenstype | Uniek | Waarden (voorbeeld) | Beschrijving |
---|---|---|---|---|
datum | datum | 420 | 2020-11-10 2021-01-30 | Datum waarvoor de dagtotalen zijn verzameld. |
date_checked | tekenreeks | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Afgeschaft |
dood | smallint | 7,327 | 2 5 | Totaalaantal personen dat tot dusverre aan COVID-19 is overleden. |
death_increase | smallint | 429 | 1 2 | Afgeschaft |
Fips | smallint | 56 | 26 55 | FIPS-code volkstelling voor de staat. |
fips_code | tekenreeks | 60 | 53 25 | FIPS-code volkstelling voor de staat. |
hekje | tekenreeks | 20,780 | 63df8cccd23a5476bab2d811b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Een hash voor deze record |
Ziekenhuis | int | 7,641 | 89995 4 | Afgeschaft |
hospitalized_cumulative | int | 7,641 | 89995 4 | Totaalaantal personen dat tot dusverre in het ziekenhuis werd opgenomen in verband met COVID-19, inclusief personen die sindsdien zijn hersteld of overleden. |
hospitalized_currently | smallint | 3,886 | 8 13 | Aantal personen in een ziekenhuis voor COVID-19 op deze dag. |
hospitalized_increase | smallint | 615 | 1 2 | Afgeschaft |
in_icu_cumulative | smallint | 2,295 | 990 220 | Totaalaantal personen dat tot dusverre op de intensivecareafdeling werd opgenomen in verband met COVID-19, inclusief personen die sindsdien zijn hersteld of overleden. |
in_icu_currently | smallint | 1,643 | 2 8 | Totaalaantal personen op een IC-afdeling voor COVID-19 op deze dag. |
iso_country | tekenreeks | 1 | VS | ISO 3166-land- of regiocode |
iso_subdivision | tekenreeks | 57 | US-UM US-WA | ISO 3166-onderverdelingscode |
last_update_et | timestamp | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | De laatste keer dat de gegevens van de dag zijn bijgewerkt |
load_time | timestamp | 1 | 2021-04-26 00:06:49.883000 | Datum en tijd waarop de gegevens vanuit de bron in Azure zijn geladen |
negatief | int | 10,864 | 305972 2140 | Totaalaantal personen dat tot dusverre negatief is getest op COVID-19. |
negative_increase | int | 7,328 | 6 17 | Afgeschaft |
on_ventilator_cumulative | smallint | 677 | 411 412 | Totaalaantal personen dat tot dusverre in verband met COVID-19 aan een beademingsapparaat heeft gelegen, inclusief personen die zijn hersteld of overleden. |
on_ventilator_currently | smallint | 837 | 4 10 | Aantal personen dat op deze dag in verband met COVID-19 aan een beademingsapparaat ligt. |
in behandeling | smallint | 944 | 2 17 | Aantal tests waarvan de resultaten nog moeten worden vastgesteld. |
pos_neg | int | 18,282 | 2140 2 | Afgeschaft |
positief | int | 16,837 | 2 1 | Totaalaantal personen dat tot dusverre positief is getest op COVID-19. |
positive_increase | smallint | 4,754 | 1 2 | Afgeschaft |
beter | int | 8,286 | 29 19 | Totaalaantal personen dat tot dusverre van COVID-19 is hersteld. |
staat | tekenreeks | 56 | MI PA | Code van twee letters voor de staat. |
total | int | 18,283 | 2140 2 | Afgeschaft |
total_test_results | int | 18,648 | 2140 3 | Totaalaantal testresultaten dat door de staat is aangeleverd |
total_test_results_increase | int | 13,463 | 1 2 | Afgeschaft |
Preview uitvoeren
datum | staat | positief | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | hekje | date_checked | dood | Ziekenhuis | total | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negatief | in_icu_cumulative | on_ventilator_cumulative | beter | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | Nul | 3-5-2021 3:59:00 uur | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 3-5-2021 3:59:00 uur | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 26-4-2021 12:06:49 uur | VS | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | Nul | 3-7-2021 11:00:00 uur | 997207b430824ea40b8eb8506c19a93e07bc972e | 3-7-2021 11:00:00 uur | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 26-4-2021 12:06:49 uur | VS | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | Nul | 3-7-2021 12:00:00 uur | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 3-7-2021 12:00:00 uur | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 26-4-2021 12:06:49 uur | VS | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | Nul | 12-1-2020 12:00:00 uur | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 12-1-2020 12:00:00 uur | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 26-4-2021 12:06:49 uur | VS | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | Nul | 3-7-2021 12:00:00 uur | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 3-7-2021 12:00:00 uur | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 26-4-2021 12:06:49 uur | VS | 3073010 | 273 | |||
2021-03-07 | CA (consistentie en beschikbaarheid) | 3501394 | 4291 | Nul | 3-7-2021 2:59:00 uur | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 3-7-2021 2:59:00 uur | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 26-4-2021 12:06:49 uur | VS | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | Nul | 3-7-2021 1:59:00 uur | 444746cda3a596f183f3fa3269c8cab68704e819 | 3-7-2021 1:59:00 uur | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 26-4-2021 12:06:49 uur | VS | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | Nul | 3-4-2021 11:59:00 uur | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 3-4-2021 11:59:00 uur | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 26-4-2021 12:06:49 uur | VS | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | Nul | 3-6-2021 12:00:00 uur | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 3-6-2021 12:00:00 uur | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 26-4-2021 12:06:49 uur | VS | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | Nul | 3-6-2021 18:00:00 uur | 059d870e689d5cc19c35f5eb398214d7d9856373 | 3-6-2021 18:00:00 uur | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | VS-DE | 26-4-2021 12:06:49 uur | VS | 545070 | 13 |
Toegang tot gegevens
Azure Notebooks
URL's van verschillende bestandsindelingen voor gegevenssets die worden gehost in Azure Blob Storage:
Download het gegevenssetbestand met behulp van de ingebouwde mogelijkheid downloaden van een HTTP-URL in Pandas. Pandas heeft lezers voor verschillende bestandsindelingen:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.
Azure Synapse
Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.
Volgende stappen
Bekijk de rest van de gegevenssets in de catalogus Open Datasets.