Оксфордская система отслеживания реагирования правительств разных стран на COVID-19

Набор данных Oxford COVID-19 Government Response Tracker (OxCGRT) содержит систематическую информацию о том, какие правительства приняли меры, какие именно это меры и когда они были приняты.

Эта информация поможет лицам, принимающим решения, и рядовым гражданам составить системное представление о мерах, принимаемых правительством, и поддержать борьбу с пандемией. В OxCGRT систематически собирается информация о ряде распространенных политических мер реагирования, принимаемых тем или иным правительством и определяется масштаб, в котором правительство внедряет эти меры. Соответствующие оценки объединяются в набор показателей политики.

Примечание.

Корпорация Майкрософт предоставляет Открытые наборы данных Azure как есть. Корпорация Майкрософт не предоставляет никаких гарантий (явных или подразумеваемых) и не определяет никаких условий в связи с использованием этих наборов данных. В рамках, допускаемых местным законодательством, корпорация Майкрософт отказывается от ответственности за ущерб и убытки (в том числе прямые, косвенные, специальные, опосредованные, случайные и штрафные), понесенные в результате использования вами этих наборов данных.

Этот набор данных предоставляется на тех же условиях, на которых корпорация Майкрософт получила исходные данные. Этот набор может включать данные, полученные от корпорации Майкрософт.

Наборы данных

Измененные версии набора данных доступны в форматах CSV, JSON, JSON Lines и Parquet (обновляются ежедневно):

Все измененные наборы данных включают коды стран согласно стандарту ISO (iso_country). Также были добавлены сведения о времени загрузки. Для имен столбцов теперь используется нижний регистр и нижнее подчеркивание в качестве разделителя.

Необработанные данные: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_policy_tracker/latest/CovidPolicyTracker.csv

Предыдущие версии измененных и необработанных данных: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_policy_tracker/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_policy_tracker/.

Объем данных

По состоянию на 8 июня 2020 г. они содержат 27 919 строк (CSV: 4,9 МБ; JSON: 20,9 МБ; JSONL: 20,8 МБ; Parquet: 133,0 КБ).

Источник данных

Источник данных: Томас Хейл (Thomas Hale), Сэм Вебстер (Sam Webster), Анна Петерик (Anna Petherick), Тоби Филлипс (Toby Phillips) и Беатрис Кира (Beatriz Kira). 2020 г. Oxford COVID-19 Government Response Tracker. Школа государственного управления Блаватника. Необработанные данные поступают ежедневно из последнего CSV-файла OxCGRT. Дополнительные сведения об этом наборе данных, в том числе о том, как он собирается, см. на сайте системы отслеживания и реагирования.

Качество данных

OxCGRT не гарантирует точность и актуальность этих данных. Дополнительные сведения см. в заявлении о качестве данных.

Лицензия и права использования; определение принадлежности

Эти данные лицензируются по лицензии Creative Commons Attribution 4.0 International.

Цитировать как: Томас Хейл, Сэм Вебстер, Анна Петерик, Тоби Филлипс, и Беатрис Кира. 2020 г. Oxford COVID-19 Government Response Tracker. Школа государственного управления Блаватника.

Контактные сведения

Вопросы и отзывы об этом и других наборах данных в озере данных COVID-19 можно направлять по адресу askcovid19dl@microsoft.com.

Столбцы

Имя. Тип данных Уникальный Значения (пример) Description
c1_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
c1_school_closing двойной точности 5 3.0 2.0 Записи о закрытии учебных заведений. 0 — никаких мер; 1 — рекомендуется закрытие; 2 — необходимо закрытие (только для некоторых уровней или категорий, например только для средних школ или только для государственных школ); 3 — необходимо закрытие для всех уровней; пусто — нет данных.
c2_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
c2_workplace_closing двойной точности 5 2.0 1.0 Записи о закрытии предприятий. 0 — никаких мер; 1 — рекомендуется закрытие (или работа в удаленном режиме); 2 — необходимо закрытие (или работа в удаленном режиме) для определенных секторов или категорий сотрудников; 3 — необходимо закрытие (или работа в удаленном режиме) всех предприятий, кроме продуктовых магазинов, больниц и т. д.; пусто — нет данных.
c3_cancel_public_events двойной точности 4 2.0 1.0 Записи об отмене массовых мероприятий. 0 — никаких мер; 1 — рекомендуется отмена мероприятий; 2 — мероприятия запрещены; пусто — нет данных.
c3_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
c4_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
c4_restrictions_on_gatherings двойной точности 6 4.0 3.0 Записи об ограничениях на частные собрания. 0 — ограничения отсутствуют; 1 — ограничение на массовые собрания (численностью более 1000 человек); 2 — ограничение на собрания численностью от 101 до 1000 человек; 3 — ограничение на собрания численностью от 11 до 100 человек; 4 — ограничение на собрания численностью до 10 человек; пусто — нет данных.
c5_close_public_transport двойной точности 4 1.0 2.0 Записи о закрытии общественного транспорта. 0 — никаких мер; 1 — рекомендуется закрытие (либо значительное сокращение объема перевозок, числа маршрутов или численности транспортных средств); 2 — необходимо закрытие (или запрет на использование общественного транспорта для большинства населения); пусто — нет данных.
c5_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
c6_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
c6_stay_at_home_requirements двойной точности 5 1.0 2.0 Записи о порядке пребывания дома и других режимах ограничения передвижения. 0 — никаких мер; 1 — рекомендуется не выходить из дома; 2 — запрещено выходить из дома, за исключением упражнений на свежем воздухе, покупки продовольственных товаров и поездок по жизненно важным вопросам; 3 — запрещено выходить из дома с минимальными исключениями (например, разрешено выходить из дома раз в неделю, одному человеку за раз и т. д.); пусто — нет данных
c7_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
c7_restrictions_on_internal_movement двойной точности 4 2.0 1.0 Записи об ограничении междугороднего и межрегионального сообщения. 0 — никаких мер; 1 — поездки между регионами и городами не рекомендуются; 2 — междугороднее и межрегиональное сообщение ограничено; пусто — нет данных.
c8_international_travel_controls двойной точности 6 3.0 4.0 Записи об ограничениях на международные поездки. Примечание: эти записи касаются политики для иностранцев, а не граждан страны. 0 — ограничения отсутствуют; 1 — контроль по прибытии; 2 — карантин по прибытии из некоторых или всех регионов; 3 — запрет на прибытие из некоторых регионов; 4 — запрет на прибытие из всех регионов или полное закрытие границ; пусто — нет данных.
confirmedcases smallint 18 238 1 2
confirmeddeaths smallint 14 906 1 2
countrycode строка 186 USA BRA
countryname строка 186 США Бразилия
Дата Дата 478 25.08.2020 30.03.2021
e1_flag boolean 3 Истина Двоичный флаг для указания сектора экономики. 0 — только работники официального сектора; 1 — также перешедшие в неофициальный сектор; пусто — нет данных.
e1_income_support двойной точности 4 1.0 2.0 Записи о том, выплачивает ли правительство пособия людям, которые потеряли работу или не имеют возможности выполнять свои должностные обязанности. Примечание: в набор данных входят только записи по фирмам с явной привязкой к официальной зарплате. 0 — пособия не выплачиваются; 1 — правительство компенсирует менее 50 % от потерянной зарплаты (или, в фиксированном выражении, менее 50 % от медианной зарплаты); 2 — правительство компенсирует более 50 % от потерянной зарплаты (или, в фиксированном выражении, более 50 % от медианной зарплаты); пусто — нет данных.
e2_debt/contract_relief двойной точности 4 1.0 2.0
e3_fiscal_measures двойной точности 19 –0,01 3,0 Объявленные расходы на стимулирование экономики. Примечание: только сумма записи в дополнение к ранее объявленной сумме расходов. Записи о бюджетных стимулах в денежном выражении (в долларах США), включая все расходы или снижение налогов, НЕ вошедшие в E4, H4 или H5. 0 — отсутствие новых расходов за указанный день; пусто — нет данных.
e4_international_support двойной точности 113 –0,02 5000000,0 Объявленные предложения о расходах на помощь covid-19 в других странах/регионах Примечание: только рекордный объем, дополнительный к ранее объявленной ранее денежной стоимости расходов в долларах США 0 - нет новых расходов в тот день Пустой - нет данных
h1_flag boolean 3 Истина Двоичный флаг географической области. 0 — целевая; 1 — общая; пусто — нет данных.
h1_public_information_campaigns двойной точности 4 2.0 1.0 Записи о наличии государственных информационных кампаний. 0 — государственная информационная кампания по COVID-19 отсутствует; 1 — власти призывают к осторожности в связи с распространением COVID-19; 2 — скоординированная государственная информационная кампания (например, в традиционных СМИ и соцсетях); пусто — нет данных.
h2_testing_policy двойной точности 5 2.0 1.0 Записи о правительственной политике относительно того, кто может проходить тестирование. Примечание: эти записи касаются политики тестирования на наличие активной инфекции (ПЦР-тесты), а не иммунитета (тест на антитела). 0 — политика тестирования отсутствует; 1 — тестирование только тех, у кого есть симптомы и кто соответствует определенным критериям (например, представители жизненно важных профессий, госпитализированные пациенты, люди, пребывавшие в контакте с больным или вернувшиеся из-за границы); 2 — тестирование всех, у кого есть симптомы COVID-19; 3 — всеобщее тестирование (например, экспресс-тестирование, доступное для людей без симптомов); пусто — нет данных.
h3_contact_tracing двойной точности 4 2.0 1.0 Записи о государственных системах отслеживания контактов людей с положительным результатом теста. Примечание: мы ищем системы, которые позволят идентифицировать всех людей с потенциальным риском заражения COVID-19; устанавливаемые добровольно Bluetooth-приложения к таким средствам не относятся. 0 — контакты не отслеживаются; 1 — ограниченное отслеживание контактов, проводится не во всех случаях; 2 — полное отслеживание контактов, проводится во всех подтвержденных случаях.
h4_emergency_investment_in_healthcare двойной точности 462 35,0 562,0 Объявленные краткосрочные расходы на систему здравоохранения, например на функционирование медицинских учреждений, обеспечение медиков масками и т. д. Примечание: только сумма записи в дополнение к ранее объявленной сумме расходов. Записи в денежном выражении (в долларах США). 0 — отсутствие новых расходов за указанный день; пусто — нет данных.
h5_investment_in_vaccines двойной точности 133 1,0 191,0 Объявленные государственные расходы на разработку вакцины от COVID-19. Примечание: только сумма записи в дополнение к ранее объявленной сумме расходов. Записи в денежном выражении (в долларах США). 0 — отсутствие новых расходов за указанный день; пусто — нет данных.
iso_country строка 186 US BR Код страны или региона согласно стандарту ISO 3166.
load_date TIMESTAMP 1 26.04.2021 00:06:25.157000 Данные даты и времени были загружены из внешнего источника.
stringencyindex двойной точности 188 11,11 60,19
stringencyindexfordisplay двойной точности 188 11,11 60,19

Предварительная версия

countryname countrycode Дата c1_school_closing c2_workplace_closing c3_cancel_public_events c4_restrictions_on_gatherings c5_close_public_transport c6_stay_at_home_requirements c7_restrictions_on_internal_movement c8_international_travel_controls e1_income_support e2_debt/contract_relief e3_fiscal_measures e4_international_support h1_public_information_campaigns h2_testing_policy h3_contact_tracing h4_emergency_investment_in_healthcare h5_investment_in_vaccines m1_wildcard stringencyindex stringencyindexfordisplay iso_country load_date
Аруба ABW 01.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 02.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 03.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 04.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 05.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 06.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 2020-01-07 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 08.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 09.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25
Аруба ABW 10.01.2020 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 null 0 0 AW 26.04.2021 00:06:25

Доступ к данным

Записные книжки Azure

В этой записной книжке документируются URL-адреса и примеры кода для доступа к набору данных Oxford Covid-19 Government Response Tracker (OxCGRT)

URL-адреса различных форматов файлов, размещенных в Хранилище BLOB-объектов Azure:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_policy_tracker/latest/covid_policy_tracker.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_policy_tracker/latest/covid_policy_tracker.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_policy_tracker/latest/covid_policy_tracker.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_policy_tracker/latest/covid_policy_tracker.parquet

Скачайте файл набора данных, используя встроенные возможности, по URL-адресу HTTP в Pandas. У Pandas есть средства чтения различных форматов файлов:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

Начните с загрузки файла набора данных в кадр данных Pandas и просмотрите некоторые примеры строк

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_policy_tracker/latest/covid_policy_tracker.parquet")
df.head(10)

Позволяет проверить типы данных в различных полях и убедиться, что в обновленном столбце используется формат даты и времени.

df.dtypes

Этот набор данных содержит данные для многочисленных стран или регионов. Позволяет проверить, для каких стран или регионов есть данные.

Начнем с просмотра последних данных для каждой страны.

df.groupby('countryname').first().filter(['confirmedcases ', 'confirmeddeaths','h5_investment_in_vaccines',
    'c6_stay_at_home_requirements','h4_emergency_investment_in_healthcare','c4_restrictions_on_gatherings', 'load_date'])

Затем выполним некоторые статистические вычисления, чтобы убедиться, что столбцы, например confirmedcases и confirmeddeaths, будут обновлены с учетом последних данных. Вы увидите, что число заболевших и умерших за последнюю дату в приведенной выше таблице соответствуют агрегату confirmedcases и confirmeddeaths.

df.groupby('countryname').agg({'countryname': 'count','confirmedcases': 'sum','confirmeddeaths': 'sum',
                               'h5_investment_in_vaccines': 'count', 'c6_stay_at_home_requirements':'sum'})

Позволяет выполнять некоторые базовые визуализации для нескольких стран или регионов

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countryname', 'confirmedcases', 
'confirmeddeaths']].groupby(['countryname']).max().sort_values(by='confirmedcases', 
                                           ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_US = df.groupby(df.date).agg({'confirmedcases': 'sum','confirmeddeaths':'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="confirmedcases",grid=True)
df_US.plot(kind='line',x='date',y="confirmeddeaths",grid=True)

Azure Databricks

Образец для комбинации платформа/пакет недоступен.

Azure Synapse

Образец для комбинации платформа/пакет недоступен.

Следующие шаги

Ознакомьтесь с другими наборами в каталоге Открытых наборов данных.