Delen via


Gegevensset Diabetes

De gegevensset Diabetes bevat 442 voorbeelden met 10 functies en is daarmee ideaal om aan de slag te gaan met algoritmen voor machine learning. Het is een van de populairste Scikit Learn Toy-gegevenssets.

Oorspronkelijke gegevenssetbeschrijving | Oorspronkelijk gegevensbestand

Notitie

Microsoft biedt Azure Open Datasets op basis van 'zoals is'. Microsoft geeft geen garanties, uitdrukkelijk of impliciet, garanties of voorwaarden met betrekking tot uw gebruik van de gegevenssets. Voor zover toegestaan volgens uw lokale wetgeving, wijst Microsoft alle aansprakelijkheid af voor eventuele schade of verliezen, waaronder directe, gevolgschade, speciale, indirecte, incidentele of strafbare gegevenssets, die het gevolg zijn van uw gebruik van de gegevenssets.

Deze gegevensset wordt geleverd onder de oorspronkelijke voorwaarden dat Microsoft de brongegevens heeft ontvangen. De gegevensset kan gegevens bevatten die afkomstig zijn van Microsoft.

Kolommen

Naam Gegevenstype Uniek Waarden (voorbeeld)
LEEFTIJD bigint 58 53 60
BMI dubbel 163 24.1 23.5
BP dubbel 100 93.0 83.0
S1 bigint 141 162 184
S2 dubbel 302 125.8 114.8
S3 dubbel 63 46.0 38.0
S4 dubbel 66 3.0 4.0
S5 dubbel 184 4.4427 4.3041
S6 bigint 56 92 96
SEX bigint 2 1 2
J bigint 214 72 200

Preview uitvoeren

LEEFTIJD SEX BMI BP S1 S2 S3 S4 S5 S6 J
59 2 32.1 101 157 93.2 38 4 4.8598 87 151
48 1 21.6 87 183 103.2 70 3 3.8918 69 75
72 2 30.5 93 156 93.6 41 4 4.6728 85 141
24 1 25.3 84 198 131.4 40 5 4.8903 89 206
50 1 23 101 192 125.4 52 4 4.2905 80 135
23 1 22.6 89 139 64.8 61 2 4.1897 68 97
36 2 22 90 160 99,6 50 3 3.9512 82 138
66 2 26.2 114 255 185 56 4.55 4.2485 92 63
60 2 32.1 83 179 119.4 42 4 4.4773 94 110
29 1 30 85 180 93.4 43 4 5.3845 88 310

Toegang tot gegevens

Gebruik de volgende codevoorbeelden voor toegang tot deze gegevensset in Azure Notebooks, Azure Databricks of Azure Synapse.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Voorbeeld niet beschikbaar voor deze combinatie van platform/pakket.

Volgende stappen

Bekijk de rest van de gegevenssets in de catalogus Open Datasets.