次の方法で共有


欧州疾病予防管理センター (ECDC) の COVID-19 のケース

欧州疾病予防管理センター (ECDC) が提供する、COVID-19 のケースの感染者の世界の地理的分布の最新の公開データです。 各行/エントリには、日あたり、国または地域あたりの新規感染者数が含まれています。

注意

Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。

このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。

データセット

データセットの編集版は、CSV、JSON、JSON-Lines、Parquet 形式で入手でき、毎日更新されます。

すべての編集済みバージョンには iso_country_region コードと読み込み時間が追加されており、小文字の列名とアンダースコアの区切り文字が使用されています。

生データ: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

以前のバージョンの編集済みデータおよび生データ: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

データ ボリューム

2020 年 5 月 28 日時点で、19,876 行 (CSV 1.5 MB、JSON 4.9 MB、JSONL 4.9 MB、Parquet 54.1 KB) が含まれています。

データ ソース

生データは、毎日 ECDC の csv ファイルから取り込まれます。 このデータセットのオリジンを含む詳細については、ECDC のデータ収集に関するページを参照してください。

データ品質

ECDC はデータの正確性と適時性については保証しません。 免責事項をお読みください

ライセンスと使用権、帰属

本データは、こちらの ECDC 著作権ポリシーで許可された範囲内で利用することができます。 著作権が第三者に帰属する文書の複製許可については、著作権者の許諾を得る必要があります。

このデータの提供元として ECDC が常に明示されている必要があります。 この明示は、資料の各コピーに含める必要があります。

Contact

ご質問がある場合や、このデータセットおよび COVID-19 Data Lake の別のデータセットについてのご意見がある場合は、お問い合わせくださいaskcovid19dl@microsoft.com。

[列]

Name データ型 一意 値 (サンプル) 説明
cases smallint 5,515 1 2 報告された感染事例の数
continent_exp string 6 ヨーロッパ アフリカ 大陸名
countries_and_territories string 214 カナダ ベルギー 国または準州の名前
country_territory_code string 213 KOR ISL 3 文字の国または準州のコード
date_rep date 350 2020-12-11 2020-11-22 レポートの日付
day smallint 31 14 13 月の日付
deaths smallint 1,049 1 2 報告された死亡者数
geo_id string 214 CA SE geo 識別子
iso_country string 214 SE US ISO 3166 国または地域コード
load_date timestamp 1 2021-04-26 00:06:22.123000 データが Azure に読み込まれた日付
month smallint 12 10 8 月の番号
year smallint 2 2020 2019 Year

プレビュー

date_rep day month year cases deaths countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-13 13 12 2020 298 9 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-12 12 12 2020 113 11 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-11 11 12 2020 63 10 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-10 10 12 2020 202 16 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-09 9 12 2020 135 13 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-08 8 12 2020 200 6 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-07 7 12 2020 210 26 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-06 6 12 2020 234 10 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF
2020-12-05 5 12 2020 235 18 アフガニスタン AF AFG Asia 2021/4/26 午前 12:06:22 AF

データ アクセス

Azure Notebooks

このノートブックには、Azure Blob Storage にホストされているさまざまなデータセット ファイル形式の欧州疾病予防管理センター (ECDC) の COVID-19 のケースのデータセット URL にアクセスするための URL とサンプル コードが記載されています。¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Pandas の組み込みのダウンロード機能を使用して、データセット ファイルを http URL からダウンロードします。 Pandas には、次のようなさまざまなファイル形式のリーダーがあります。

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。

Azure Synapse

このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。

このデータセットの使用例を参照してください。

次のステップ

Open Datasets カタログの残りのデータセットを表示します。