Bing COVID-19
Bing 新型冠狀病毒 (COVID-19) 資料每日更新,提供來自所有區域的確診、死亡及治癒病例數。 Bing COVID-19 追蹤器會反映此數據。
Bing 會從多個受信任的可靠來源收集數據,包括:
- BNO 新聞
- 疾病控制和預防中心(CDC)
- 國家/地區和國家公共衛生部門
- 維琪百科
- 世界衛生組織(世衛組織)
- 24/7 牆街
注意
Microsoft 依「現況」提供 Azure 開放資料集。 針對 貴用戶對資料集的使用方式,Microsoft 不提供任何明示或默示的擔保、保證或條件。 在 貴用戶當地法律允許的範圍內,針對因使用資料集而導致的任何直接性、衍生性、特殊性、間接性、附隨性或懲罰性損害或損失,Microsoft 概不承擔任何責任。
此資料集是根據 Microsoft 接收來源資料的原始條款所提供。 資料集可能包含源自 Microsoft 的資料。
資料集
已修改的 Bing COVID-19 數據集可在 CSV、JSON、JSON-Lines 和 Parquet 中使用:
所有修改過的數據集都有 ISO 3166 細分代碼,並新增加載時間。 它們使用小寫數據行名稱與底線分隔符。
此資源提供舊版的已修改和原始數據。
資料量
所有數據集都會接收每日更新。 截至 2023 年 3 月 5 日,它們包含 4,766,737 個數據列。 資料集可透過下列檔案格式取得:
- CSV (560.3 MB)
- JSON (1515.6 MB)
- JSONL (1506.2 MB)
- Parquet (55.4 MB)
授權和使用權限出處
這些數據嚴格適用於這些條款及條件下的教育和學術用途。 有效用途包括:
- 學術機構
- 政府機構
- 醫學研究
發行集中使用或引用的數據應包含 「Bing COVID-19 追蹤器」的屬性,以及 www.bing.com/covid 的連結。
連絡人
如需有關 COVID-19 Data Lake 中此資料集或其他資料集的任何問題或意見反應,請連絡 askcovid19dl@microsoft.com。
資料行
名稱 | 資料類型 | 唯一 | Values (sample) | 描述 |
---|---|---|---|---|
admin_region_1 | 字串 | 864 | 德克薩斯州喬治亞州 | country_region 中的地區 |
admin_region_2 | 字串 | 3,143 | 華盛頓縣傑斐遜縣 | admin_region_1 中的地區 |
證實 | int | 120,692 | 1 和 2 | 地區的確診人數 |
confirmed_change | int | 12,120 | 1 和 2 | 與前一天相比的確診人數變化 |
country_region | 字串 | 237 | 美國 印度 | 國家/地區 |
deaths | int | 20,616 | 1 和 2 | 地區的死亡人數 |
deaths_change | smallint | 1,981 | 1 和 2 | 與前一天相比的死亡人數變化 |
id | int | 1,783,534 | 742546 69019298 | 唯一識別碼 |
iso_subdivision | 字串 | 484 | US-TX US-GA | 由兩部分組成的 ISO 次級行政區代碼 |
iso2 | 字串 | 226 | 美國 IN | 2 個字母的國碼 (地區碼) 識別碼 |
iso3 | 字串 | 226 | USA IND | 3 個字母的國碼 (地區碼) 識別碼 |
緯度 | double | 5,675 | 42.28708 19.59852 | 地區中心的緯度 |
load_time | timestamp | 1 | 2021-04-26 00:06:34.719000 | 從 GitHub 上 Bing 來源載入檔案的日期與時間 |
經度 | double | 5,693 | -2.5396 -155.5186 | 地區中心的經度 |
恢復 | int | 73,287 | 1 和 2 | 地區的康復人數 |
recovered_change | int | 10,441 | 1 和 2 | 與前一天相比的康復人數變化 |
已更新 | date | 457 | 2021-04-23 2021-04-22 | 記錄的截止日期 |
預覽
id | 已更新 | 證實 | deaths | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | load_time | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | ||
338996 | 2020-01-22 | 313 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 51 | 0 |
338997 | 2020 年 1 月 23 日 | 578 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 265 | 0 |
338998 | 2020-01-24 | 841 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 263 | 0 |
338999 | 2020-01-25 | 1320 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 479 | 0 |
339000 | 2020-01-26 | 2014 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 694 | 0 |
339001 | 2020-01-27 | 2798 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 784 | 0 |
339002 | 2020 年 1 月 28 日 | 4593 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 1795 | 0 |
339003 | 2020-01-29 | 6065 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 1472 | 0 |
339004 | 2020-01-30 | 7818 | 0 | null | null | 全球 | null | null | null | 2021/4/26 上午 12:06:34 | 1753 | 0 |
數據存取 - Azure Notebooks
注意
此筆記本記載 URL 和範例程式代碼,以存取 Bing COVID-19 數據集。
使用這些網址來取得載入Azure Blob 儲存體的特定檔案格式:
使用 Pandas 的內建功能下載數據集檔案,以從 HTTP URL 下載。 Pandas 具有各種檔案格式的讀取器:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
若要確認更新的數據列具有日期時間格式,請檢查各種欄位的數據類型:
df.dtypes
檢閱全球數據。 若要將數據可視化,請建置一些圖表:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
數據存取 - Azure Databricks
此平臺/套件組合無法使用範例。
數據存取 - Azure Synapse
此平臺/套件組合無法使用範例。
下一步
檢視開放資料集目錄中的其餘資料集。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應