Bagikan melalui


Bing COVID-19

Data COVID-19 Bing mencakup kasus yang dikonfirmasi, fatal, dan pulih dari semua wilayah, diperbarui setiap hari. Pelacak Bing COVID-19 mencerminkan data ini.

Bing mengumpulkan data dari beberapa sumber tepercaya dan andal, termasuk:

Catatan

Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.

Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.

Himpunan data

Himpunan data Bing COVID-19 yang dimodifikasi tersedia di CSV, JSON, JSON-Lines, dan Parquet:

Semua himpunan data yang dimodifikasi memiliki kode subdivisi ISO 3166 dan waktu muat ditambahkan. Mereka menggunakan nama kolom huruf kecil dengan pemisah garis bawah.

Data mentah format CSV

Versi data yang dimodifikasi dan mentah yang lebih lama tersedia di sumber daya ini.

Volume data

Semua himpunan data menerima pembaruan harian. Per 5 Maret 2023 berisi 4.766.737 baris. Himpunan data tersedia dalam format file ini:

  • CSV (560,3 MB)
  • JSON (1515,6 MB)
  • JSONL (1506,2 MB)
  • Parquet (55,4 MB)

Atribusi lisensi dan hak penggunaan

Data ini tersedia secara ketat untuk tujuan pendidikan dan akademik dalam syarat dan ketentuan ini. Tujuan yang valid meliputi:

  • lembaga akademik
  • lembaga pemerintah
  • penelitian medis

Data yang digunakan atau dikutip dalam publikasi harus menyertakan atribusi ke 'Bing COVID-19 Tracker', dengan tautan ke www.bing.com/covid.

Kontak

Untuk pertanyaan atau umpan balik apa pun tentang himpunan data ini atau himpunan data lainnya dalam kontak askcovid19dl@microsoft.comData Lake COVID-19 .

Kolom

Nama Jenis data Unik Nilai (sampel) Deskripsi
admin_region_1 string 864 Texas Georgia Wilayah dalam negara_wilayah
admin_region_2 string 3.143 Washington County Jefferson County Region within admin_region_1
dikonfirmasi int 120.692 1 2 Jumlah kasus yang dikonfirmasi untuk wilayah tersebut
confirmed_change int 12.120 1 2 Perubahan jumlah kasus yang dikonfirmasi dari hari sebelumnya
country_region string 237 India Amerika Serikat Negara/wilayah
kematian int 20.616 1 2 Jumlah kasus kematian untuk wilayah tersebut
deaths_change smallint 1.981 1 2 Jumlah perubahan kematian dari hari sebelumnya
id int 1.783.534 742546 69019298 Pengidentifikasi unik
iso_subdivision string 484 US-TX US-GA Kode subdivisi ISO dua bagian
iso2 string 226 US IN Pengidentifikasi kode negara 2 huruf
iso3 string 226 IND AS Pengidentifikasi kode negara 3 huruf
garis lintang ganda 5.675 42.28708 19.59852 Garis lintang dari pusat wilayah
waktu_pemuatan rentang waktu 1 26-04-2012 00.06.34.719000 Tanggal dan waktu file dimuat dari sumber Bing pada GitHub
garis bujur ganda 5,693 -2.5396 -155.5186 Garis bujur dari pusat wilayah
pulih int 73,287 1 2 Jumlah yang pulih untuk wilayah tersebut
recovered_change int 10,441 1 2 Perubahan jumlah kasus yang pulih dari hari sebelumnya
diperbarui date 457 23-04-2021 22-04-2021 Tanggal pencatatan

Pratinjau

id diperbarui dikonfirmasi kematian iso2 iso3 country_region admin_region_1 iso_subdivision admin_region_2 waktu_pemuatan confirmed_change deaths_change
338995 2020-01-21 262 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34
338996 22-01-2020 313 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 51 0
338997 23-01-2020 578 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 265 0
338998 24-01-2020 841 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 263 0
338999 25-01-2020 1320 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 479 0
339000 26-01-2020 2014 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 694 0
339001 27-01-2020 2798 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 784 0
339002 28-01-2020 4593 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 1795 0
339003 29-01-2020 6065 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 1472 0
339004 30-01-2020 7818 0 null null Di seluruh dunia null null null 26/04/2021 Pukul 12.06.34 1753 0

Akses data - Azure Notebooks

Catatan

Notebook ini mendokumen URL dan kode sampel untuk mengakses Himpunan Data Bing COVID-19.

Gunakan URL ini untuk mendapatkan format file tertentu yang dihosting di Azure Blob Storage:

Unduh file himpunan data menggunakan kemampuan bawaan Pandas untuk diunduh dari URL HTTP. Pandas memiliki pembaca untuk berbagai format file:

pandas.read_parquet

pandas.read_csv

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/bing_covid-19_data/latest/bing_covid-19_data.parquet")
df.head(10)

Untuk memverifikasi bahwa kolom yang diperbarui memiliki format tanggalwaktu, periksa jenis data dari berbagai bidang:

df.dtypes

Tinjau data Di Seluruh Dunia. Untuk memvisualisasikan data, buat beberapa bagan:

df_Worldwide=df[df['country_region']=='Worldwide']
df_Worldwide_pivot=df_Worldwide.pivot_table(df_Worldwide, index=['country_region','updated'])

df_Worldwide_pivot
df_Worldwide.plot(kind='line',x='updated',y="confirmed",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="confirmed_change",grid=True)
df_Worldwide.plot(kind='line',x='updated',y="deaths_change",grid=True)

Akses Data - Azure Databricks

Sampel tidak tersedia untuk kombinasi platform /paket ini.

Akses Data - Azure Synapse

Sampel tidak tersedia untuk kombinasi platform /paket ini.

Langkah berikutnya

Lihat himpunan data lainnya di katalog Open Datasets.