Dela via


Datauppsättning för diabetes

Diabetes-datamängden innehåller 442 exempel med 10 funktioner, vilket gör den idealisk för att komma igång med Machine Learning-algoritmer. Det är en av de mest populära Scikit Learn Toy Datasets.

Ursprunglig datauppsättningsbeskrivning | Originaldatafil

Kommentar

Microsoft tillhandahåller Azure Open Datasets i befintligt fall. Microsoft ger inga garantier, uttryckliga eller underförstådda garantier eller villkor för din användning av datauppsättningarna. I den utsträckning som tillåts enligt din lokala lag frånsäger sig Microsoft allt ansvar för eventuella skador eller förluster, inklusive direkt, följdriktig, särskild, indirekt, tillfällig eller straffbar, till följd av din användning av datauppsättningarna.

Datamängden tillhandahålls enligt de ursprungliga villkor som gällde när Microsoft tog emot källdatan. Datamängden kan innehålla data från Microsoft.

Kolumner

Name Datatyp Unik Värden (exempel)
ÅLDER bigint 58 53 60
BMI dubbel 163 24.1 23.5
BP dubbel 100 93.0 83.0
S1 bigint 141 162 184
S2 dubbel 302 125.8 114.8
S3 dubbel 63 46.0 38.0
S4 dubbel 66 3.0 4.0
S5 dubbel 184 4.4427 4.3041
S6 bigint 56 92 96
KÖN bigint 2 1 2
Y bigint 214 72 200

Förhandsversion

ÅLDER KÖN BMI BP S1 S2 S3 S4 S5 S6 Y
59 2 32,1 101 157 93.2 38 4 4,8598 87 151
48 1 21,6 87 183 103.2 70 3 3,8918 69 75
72 2 30,5 93 156 93.6 41 4 4,6728 85 141
24 1 25,3 84 198 131.4 40 5 4,8903 89 206
50 1 23 101 192 125.4 52 4 4,2905 80 135
23 1 22,6 89 139 64.8 61 2 4,1897 68 97
36 2 22 90 160 99,6 50 3 3,9512 82 138
66 2 26,2 114 255 185 56 4,55 4,2485 92 63
60 2 32,1 83 179 119.4 42 4 4,4773 94 110
29 1 30 85 180 93,4 43 4 5,3845 88 310

Dataåtkomst

Använd följande kodexempel för att komma åt den här datauppsättningen i Azure Notebooks, Azure Databricks eller Azure Synapse.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Exempel är inte tillgängligt för den här kombinationen av plattform/paket.

Nästa steg

Visa resten av datauppsättningarna i katalogen Öppna datamängder.