Diabetes-adatkészlet

A diabétesz adatkészlet 442 mintát tartalmaz 10 jellemzővel, így ideális választás ahhoz, hogy megismerkedjünk a gépi tanulási algoritmusokkal. Ez az egyik legnépszerűbb Scikit Learn Toy-adatkészlet.

Az adathalmaz eredeti leírása | Eredeti adatfájl

Megjegyzés

A Microsoft "adott módon" biztosítja az Azure Open Datasets szolgáltatást. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A helyi jogszabályok által megengedett mértékig a Microsoft kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, járulékos vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Oszlopok

Name Adattípus Egyedi Értékek (minta)
KOR bigint 58 53 60
BMI (Testtömegindex) double 163 24.1 23.5
BP double 100 93.0 83.0
S1 bigint 141 162 184
S2 double 302 125.8 114.8
S3 double 63 46.0 38.0
S4 double 66 3.0 4.0
S5 double 184 4.4427 4.3041
S6 bigint 56 92 96
SZEX bigint 2 1 2
Y bigint 214 72 200

Előnézet

KOR SZEX BMI (Testtömegindex) BP S1 S2 S3 S4 S5 S6 Y
59 2 32.1 101 157 93.2 38 4 4.8598 87 151
48 1 21.6 87 183 103.2 70 3 3.8918 69 75
72 2 30,5 93 156 93.6 41 4 4.6728 85 141
24 1 25,3 84 198 131.4 40 5 4.8903 89 206
50 1 23 101 192 125.4 52 4 4.2905 80 135
23 1 22.6 89 139 64.8 61 2 4.1897 68 97
36 2 22 90 160 99.6 50 3 3.9512 82 138
66 2 26,2 114 255 185 56 4.55 4.2485 92 63
60 2 32.1 83 179 119.4 42 4 4.4773 94 110
29 1 30 85 180 93,4 43 4 5.3845 88 310

Az adatok elérése

Az alábbi kódmintákkal érheti el ezt az adatkészletet az Azure Notebooksban, az Azure Databricksben vagy Azure Synapse.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

A minta nem érhető el ehhez a platformhoz/csomagkombinációhoz.

Következő lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.