Bing COVID-19
Bing COVID-19 データには、すべてのリージョンからの確定、重症、回復した症例が含まれ、毎日更新されます。 このデータは Bing COVID-19 トラッカーで反映されています。
Bing は、世界保健機関 (WHO)、アメリカ疾病予防管理センター (CDC)、国家、地域および州の公的医療部門、BNO News、24/7 Wall St.、Wikipedia など、複数の信頼できるソースからデータを収集しています。
注意
Microsoft は、Azure Open Datasets を "現状有姿" で提供します。 Microsoft は、データセットの使用に関して、明示または黙示を問わず、いかなる保証も行わないものとし、条件を定めることもありません。 現地の法律の下で認められている範囲内で、Microsoft は、データセットの使用に起因する、直接的、派生的、特別、間接的、偶発的、または懲罰的なものを含めたいかなる損害または損失に対しても一切の責任を負わないものとします。
このデータセットは、Microsoft がソース データを受け取った元の条件に基づいて提供されます。 データセットには、Microsoft が提供するデータが含まれている場合があります。
データセット
編集されたデータセットは、CSV、JSON、JSON-Lines、Parquet で提供されます。
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet
すべての編集済みデータセットには ISO 3166 下位コードと読み込み時間が追加されており、小文字の列名とアンダースコアの区切り文字が使用されています。
以前のバージョンの編集済みデータおよび生データ: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/
データ ボリューム
すべてのデータセットは毎日更新されます。 2020 年 5 月 11 日時点で、125,576 行 (CSV 16.1 MB, JSON 40.0 MB, JSONL 39.6 MB, Parquet 1.1 MB) が含まれています。
ライセンスと使用権の帰属
本データは、ご契約条件に従い、医学研究、政府機関、学術機関などの教育および学術目的に限定して使用できます。
出版物で使用または引用されているデータには、'Bing COVID-19 トラッカー' の帰属と www.bing.com/covid のリンクを含める必要があります。
Contact
ご質問がある場合や、このデータセットおよび COVID-19 Data Lake の別のデータセットについてのご意見がある場合は、お問い合わせくださいaskcovid19dl@microsoft.com。
[列]
Name | データ型 | 一意 | 値 (サンプル) | 説明 |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | country_region 内のリージョン |
admin_region_2 | string | 3,143 | Washington County Jefferson County | admin_region_1 内のリージョン |
confirmed | INT | 120,692 | 1 2 | リージョンの確定者数 |
confirmed_change | INT | 12,120 | 1 2 | 前日からの確定者数の変更 |
country_region | string | 237 | United States India | 国/リージョン |
deaths | INT | 20,616 | 1 2 | リージョンの死亡者数 |
deaths_change | smallint | 1,981 | 1 2 | 前日からの死亡者の変更 |
id | INT | 1,783,534 | 742546 69019298 | 一意識別子 |
iso_subdivision | string | 484 | US-TX US-GA | 2 つの部分から成る ISO 下位コード |
iso2 | string | 226 | US IN | 2 文字の国番号識別子 |
iso3 | string | 226 | USA IND | 3 文字の国番号識別子 |
緯度 (latitude) | double | 5,675 | 42.28708 19.59852 | リージョンの中心の緯度 |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | ファイルが GitHub 上の Bing ソースから読み込まれた日時 |
経度 (longitude) | double | 5,693 | -2.5396 -155.5186 | リージョンの中心の経度 |
recovered | INT | 73,287 | 1 2 | リージョンの回復者数 |
recovered_change | INT | 10,441 | 1 2 | 前日からの回復者数の変更 |
更新済み | date | 457 | 2021-04-23 2021-04-22 | レコードの現時点 |
プレビュー
id | 更新済み | confirmed | deaths | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | ||
338996 | 2020-01-22 | 313 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 51 | 0 |
338997 | 2020-01-23 | 578 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 784 | 0 |
339002 | 2020-01-28 | 4593 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | 世界全域 | null | null | null | 4/26/2021 12:06:34 AM | 1753 | 0 |
データ アクセス
Azure Notebooks
このノートブックには、Bing COVID-19 データセットにアクセスするための URL とサンプル コードが記載されています。
Azure Blob Storage にホストされている特定のファイル形式を取得するには、次の URL を使用します。
Pandas の組み込みのダウンロード機能を使用して、データセット ファイルを http URL からダウンロードします。 Pandas には、次のようなさまざまなファイル形式のリーダーがあります。
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
さまざまなフィールドのデータ型を確認し、更新された列が datetime 形式であることを確認してみましょう
df.dtypes
次に、世界規模のデータを調べ、簡単なグラフをプロットしてデータを可視化します
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Azure Databricks
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
Azure Synapse
このプラットフォームとパッケージの組み合わせでは、サンプルは利用できません。
次のステップ
Open Datasets カタログの残りのデータセットを表示します。