Bing COVID-19
Data COVID-19 Bing mencakup kasus yang dikonfirmasi, fatal, dan pulih dari semua wilayah, diperbarui setiap hari. Pelacak Bing COVID-19 mencerminkan data ini.
Bing mengumpulkan data dari beberapa sumber tepercaya dan andal, termasuk:
- Berita BNO
- Pusat Pengendalian dan Pencegahan Penyakit (CDC)
- Departemen kesehatan masyarakat nasional/regional dan negara bagian
- Wikipedia
- Organisasi Kesehatan Dunia (WHO)
- 24/7 Wall St.
Catatan
Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.
Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.
Himpunan data
Himpunan data Bing COVID-19 yang dimodifikasi tersedia di CSV, JSON, JSON-Lines, dan Parquet:
Semua himpunan data yang dimodifikasi memiliki kode subdivisi ISO 3166 dan waktu muat ditambahkan. Mereka menggunakan nama kolom huruf kecil dengan pemisah garis bawah.
Versi data yang dimodifikasi dan mentah yang lebih lama tersedia di sumber daya ini.
Volume data
Semua himpunan data menerima pembaruan harian. Per 5 Maret 2023 berisi 4.766.737 baris. Himpunan data tersedia dalam format file ini:
- CSV (560,3 MB)
- JSON (1515,6 MB)
- JSONL (1506,2 MB)
- Parquet (55,4 MB)
Atribusi lisensi dan hak penggunaan
Data ini tersedia secara ketat untuk tujuan pendidikan dan akademik dalam syarat dan ketentuan ini. Tujuan yang valid meliputi:
- lembaga akademik
- lembaga pemerintah
- penelitian medis
Data yang digunakan atau dikutip dalam publikasi harus menyertakan atribusi ke 'Bing COVID-19 Tracker', dengan tautan ke www.bing.com/covid.
Kontak
Untuk pertanyaan atau umpan balik apa pun tentang himpunan data ini atau himpunan data lainnya dalam kontak askcovid19dl@microsoft.comData Lake COVID-19 .
Kolom
Nama | Jenis data | Unik | Nilai (sampel) | Deskripsi |
---|---|---|---|---|
admin_region_1 | string | 864 | Texas Georgia | Wilayah dalam negara_wilayah |
admin_region_2 | string | 3.143 | Washington County Jefferson County | Region within admin_region_1 |
dikonfirmasi | int | 120.692 | 1 2 | Jumlah kasus yang dikonfirmasi untuk wilayah tersebut |
confirmed_change | int | 12.120 | 1 2 | Perubahan jumlah kasus yang dikonfirmasi dari hari sebelumnya |
country_region | string | 237 | India Amerika Serikat | Negara/wilayah |
kematian | int | 20.616 | 1 2 | Jumlah kasus kematian untuk wilayah tersebut |
deaths_change | smallint | 1.981 | 1 2 | Jumlah perubahan kematian dari hari sebelumnya |
id | int | 1.783.534 | 742546 69019298 | Pengidentifikasi unik |
iso_subdivision | string | 484 | US-TX US-GA | Kode subdivisi ISO dua bagian |
iso2 | string | 226 | US IN | Pengidentifikasi kode negara 2 huruf |
iso3 | string | 226 | IND AS | Pengidentifikasi kode negara 3 huruf |
garis lintang | ganda | 5.675 | 42.28708 19.59852 | Garis lintang dari pusat wilayah |
waktu_pemuatan | rentang waktu | 1 | 26-04-2012 00.06.34.719000 | Tanggal dan waktu file dimuat dari sumber Bing pada GitHub |
garis bujur | ganda | 5,693 | -2.5396 -155.5186 | Garis bujur dari pusat wilayah |
pulih | int | 73,287 | 1 2 | Jumlah yang pulih untuk wilayah tersebut |
recovered_change | int | 10,441 | 1 2 | Perubahan jumlah kasus yang pulih dari hari sebelumnya |
diperbarui | date | 457 | 23-04-2021 22-04-2021 | Tanggal pencatatan |
Pratinjau
id | diperbarui | dikonfirmasi | kematian | iso2 | iso3 | country_region | admin_region_1 | iso_subdivision | admin_region_2 | waktu_pemuatan | confirmed_change | deaths_change |
---|---|---|---|---|---|---|---|---|---|---|---|---|
338995 | 2020-01-21 | 262 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | ||
338996 | 22-01-2020 | 313 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 51 | 0 |
338997 | 23-01-2020 | 578 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 265 | 0 |
338998 | 24-01-2020 | 841 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 263 | 0 |
338999 | 25-01-2020 | 1320 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 479 | 0 |
339000 | 26-01-2020 | 2014 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 694 | 0 |
339001 | 27-01-2020 | 2798 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 784 | 0 |
339002 | 28-01-2020 | 4593 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 1795 | 0 |
339003 | 29-01-2020 | 6065 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 1472 | 0 |
339004 | 30-01-2020 | 7818 | 0 | null | null | Di seluruh dunia | null | null | null | 26/04/2021 Pukul 12.06.34 | 1753 | 0 |
Akses data - Azure Notebooks
Catatan
Notebook ini mendokumen URL dan kode sampel untuk mengakses Himpunan Data Bing COVID-19.
Gunakan URL ini untuk mendapatkan format file tertentu yang dihosting di Azure Blob Storage:
Unduh file himpunan data menggunakan kemampuan bawaan Pandas untuk diunduh dari URL HTTP. Pandas memiliki pembaca untuk berbagai format file:
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)
Untuk memverifikasi bahwa kolom yang diperbarui memiliki format tanggalwaktu, periksa jenis data dari berbagai bidang:
df.dtypes
Tinjau data Di Seluruh Dunia. Untuk memvisualisasikan data, buat beberapa bagan:
df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])
df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)
Akses Data - Azure Databricks
Sampel tidak tersedia untuk kombinasi platform /paket ini.
Akses Data - Azure Synapse
Sampel tidak tersedia untuk kombinasi platform /paket ini.
Langkah berikutnya
Lihat himpunan data lainnya di katalog Open Datasets.