Europejskie Centrum Zapobiegania Chorobom i Kontroli (ECDC) Przypadki COVID-19
Najnowsze dostępne publiczne dane dotyczące dystrybucji geograficznej przypadków COVID-19 na całym świecie z Europejskiego Centrum Zapobiegania Chorobom i Kontroli (ECDC). Każdy wiersz/wpis zawiera liczbę nowych przypadków z podziałem na dzień i kraj lub region.
Uwaga
Firma Microsoft udostępnia zestawy danych Azure Open Datasets w zasadzie "tak jak to jest". Firma Microsoft nie udziela żadnych gwarancji, wyraźnych lub domniemanych, gwarancji ani warunków w odniesieniu do korzystania z zestawów danych. W zakresie dozwolonym na mocy prawa lokalnego firma Microsoft nie ponosi odpowiedzialności za wszelkie szkody lub straty, w tym bezpośrednie, wynikowe, specjalne, pośrednie, przypadkowe lub karne wynikające z korzystania z zestawów danych.
Zestaw danych jest udostępniany zgodnie z pierwotnymi warunkami, na jakich firma Microsoft otrzymała dane źródłowe. Zestaw danych może zawierać dane pozyskane z firmy Microsoft.
Zestawy danych
Zmodyfikowane wersje zestawu danych są dostępne w formatach CSV, JSON, JSON-Lines i Parquet (aktualizowane codziennie):
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Wszystkie zmodyfikowane wersje mają dodane kody iso_country_region i czasy ładowania oraz używają nazw kolumn pisanych małymi literami z separatorami w postaci znaków podkreślenia.
Dane pierwotne: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
Poprzednie wersje zmodyfikowanych i pierwotnych danych: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Ilość danych
Na dzień 28 maja 2020 r. zawierały 19 876 wierszy (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 KB).
Źródło danych
Dane pierwotne są pozyskiwane codziennie z pliku CSV ECDC. Aby uzyskać więcej informacji na temat tego zestawu danych, w tym jego pochodzenia, zobacz stronę zbierania danych ECDC.
Jakość danych
Europejskie Centrum ds. Zapobiegania i Kontroli Chorób nie gwarantuje dokładności ani stosowności danych. Przeczytaj zastrzeżenie.
Przypisywanie praw do licencji i użytkowania
Te dane są udostępniane i mogą być używane zgodnie z zasadami dotyczącymi praw autorskich Europejskiego Centrum ds. Zapobiegania i Kontroli Chorób, które można znaleźć tutaj. W przypadku wszelkich dokumentów, do których prawa autorskie mają strony trzecie, zgodę na powielanie należy uzyskać od posiadacza praw autorskich.
Zawsze należy powiadomić Europejskie Centrum ds. Zapobiegania i Kontroli Chorób, jako oryginalne źródło tych danych. Takie potwierdzenie musi być zawarte w każdej kopii materiału.
Kontakt
W razie jakichkolwiek pytań lub opinii dotyczących tego zestawu danych lub innych zestawów danych w usłudze COVID-19 Data Lake, skontaktuj się z askcovid19dl@microsoft.com.
Kolumny
Nazwa | Typ danych | Unikatowe | Wartości (przykład) | Opis |
---|---|---|---|---|
Przypadkach | smallint | 5,515 | 1 2 | Liczba zgłoszonych przypadków |
continent_exp | ciąg | 6 | Europa Afryka | Nazwa kontynentu |
countries_and_territories | ciąg | 214 | Kanada Belgia | Nazwa kraju lub terytorium |
country_territory_code | ciąg | 213 | KOR ISL | Trzyliterowy kod kraju lub terytorium |
date_rep | data | 350 | 2020-12-11 2020-11-22 | Data raportu |
dzień | smallint | 31 | 14 13 | Dzień miesiąca |
Zgonów | smallint | 1,049 | 1 2 | Liczba zgłoszonych zgonów |
geo_id | ciąg | 214 | URZĄD CERTYFIKACJI SE | Identyfikator geograficzny |
iso_country | ciąg | 214 | SE US | Kod kraju lub regionu w standardzie ISO 3166 |
load_date | sygnatura czasowa | 1 | 2021-04-26 00:06:22.123000 | Data załadowania danych na platformę Azure |
miesiąc | smallint | 12 | 10 8 | Numer miesiąca |
rok | smallint | 2 | 2020 2019 | Year (Rok) |
Wersja zapoznawcza
date_rep | dzień | miesiąc | rok | Przypadkach | Zgonów | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afganistan | AF | AFG | Azja | 26.04.2021 12:06:22 | AF |
Dostęp do danych
Azure Notebooks
Ten notes zawiera dokumenty adresów URL i przykładowego kodu umożliwiającego dostęp do europejskiego Centrum Zapobiegania Chorobom i Kontroli (ECDC) Adresy URL zestawu danych przypadków covid-19 różnych formatów plików zestawów danych hostowanych na Azure Blob Storage: CSV:https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Pobierz plik zestawu danych przy użyciu wbudowanej funkcji pobierania z adresu URL http w bibliotece Pandas. Biblioteka Pandas ma czytniki dla różnych formatów plików:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Azure Synapse
Przykład nie jest dostępny dla tej kombinacji platformy/pakietu.
Przykłady
Zobacz przykłady użycia tego zestawu danych:
- Analizowanie danych COVID przy użyciu bezserwerowego punktu końcowego usługi Synapse SQL
- Analiza regresji liniowej danych COVID przy użyciu punktu końcowego SQL w usłudze Azure Synapse Analytics
Następne kroki
Wyświetl resztę zestawów danych w katalogu Open Datasets (Otwarte zestawy danych).