Набор данных Diabetes (Диабет)

Набор данных Diabetes (Диабет) содержит 442 образца с 10 признаками. Он идеально подходит для начала работы с алгоритмами машинного обучения. Это один из самых популярных наборов данных Scikit Learn Toy.

Описание исходного набора данных | Исходный файл данных

Примечание

Корпорация Майкрософт предоставляет Открытые наборы данных Azure как есть. Корпорация Майкрософт не предоставляет никаких гарантий (явных или подразумеваемых) и не определяет никаких условий в связи с использованием этих наборов данных. В рамках, допускаемых местным законодательством, корпорация Майкрософт отказывается от ответственности за ущерб и убытки (в том числе прямые, косвенные, специальные, опосредованные, случайные и штрафные), понесенные в результате использования вами этих наборов данных.

Этот набор данных предоставляется на тех же условиях, на которых корпорация Майкрософт получила исходные данные. Этот набор может включать данные, полученные от корпорации Майкрософт.

Столбцы

Имя Тип данных Уникальная идентификация Значения (пример)
AGE BIGINT 58 53 60
BMI double 163 24,1 23,5
BP double 100 93,0 83,0
S1 BIGINT 141 162 184
S2 double 302 125,8 114,8
S3 double 63 46,0 38,0
S4 double 66 3,0 4,0
S5 double 184 4,4427 4,3041
S6 BIGINT 56 92 96
SEX BIGINT 2 1 2
Да BIGINT 214 72 200

Предварительный просмотр

AGE SEX BMI BP S1 S2 S3 S4 S5 S6 Да
59 2 32,1 101 157 93,2 38 4 4,8598 87 151
48 1 21,6 87 183 103,2 70 3 3,8918 69 75
72 2 30.5 93 156 93,6 41 4 4,6728 85 141
24 1 25,3 84 198 131,4 40 5 4,8903 89 206
50 1 23 101 192 125,4 52 4 4,2905 80 135
23 1 22,6 89 139 64,8 61 2 4,1897 68 97
36 2 22 90 160 99,6 50 3 3,9512 82 138
66 2 26,2 114 255 185 56 4.55 4.2485 92 63
60 2 32,1 83 179 119,4 42 4 4,4773 94 110
29 1 30 85 180 93,4 43 4 5,3845 88 310

Доступ к данным

Используйте приведенные ниже примеры кода для доступа к этому набору данных в Записных книжках Azure, в Azure Databricks и Azure Synapse.

Записные книжки Azure

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Пример для этого сочетания платформы и пакета недоступен.

Дальнейшие действия

Ознакомьтесь с другими наборами в каталоге Открытых наборов данных.