Share via


Importeren vanuit een Azure SQL Database

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel wordt beschreven hoe u de module Gegevens importeren in Machine Learning Studio (klassiek) gebruikt om gegevens op te halen uit een Azure SQL Database of Azure SQL Data Warehouse.

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Als u gegevens uit een database wilt importeren, moet u zowel de servernaam als de databasenaam en een SQL-instructie opgeven die de tabel, weergave of query definieert.

Over het algemeen is het opslaan van gegevens in Azure-databases duurder dan het gebruik van tabellen of blobs in Azure. Er kunnen ook beperkingen zijn voor de hoeveelheid gegevens die u in een database kunt opslaan, afhankelijk van uw abonnementstype. Er zijn echter geen transactiekosten voor SQL Azure Database, dus deze optie is ideaal voor snelle toegang tot kleinere hoeveelheden veelgebruikte informatie, zoals gegevenszoektabellen of gegevenswoordenlijsten.

Het opslaan van gegevens in een Azure-database heeft ook de voorkeur als u gegevens moet kunnen filteren voordat u deze leest, of als u voorspellingen of metrische gegevens wilt opslaan in de database voor rapportage.

Gegevens importeren uit Azure SQL Database of SQL Data Warehouse

De wizard Gegevens importeren gebruiken

De module bevat een nieuwe wizard om u te helpen een opslagoptie te kiezen, een keuze te maken uit bestaande abonnementen en accounts en snel alle opties te configureren.

  1. Voeg de module Gegevens importeren toe aan uw experiment. U vindt de module in Studio (klassiek) in de categorie Gegevensinvoer en -uitvoer.

  2. Klik op Wizard Gegevens importeren starten en volg de aanwijzingen.

  3. Wanneer de configuratie is voltooid, kopieert u de gegevens daadwerkelijk naar uw experiment, klikt u met de rechtermuisknop op de module en selecteert u Geselecteerde uitvoeren.

Als u een bestaande gegevensverbinding wilt bewerken, laadt de wizard alle eerdere configuratiegegevens, zodat u niet opnieuw opnieuw hoeft te beginnen

Handmatig eigenschappen instellen in de module Gegevens importeren

In de volgende stappen wordt beschreven hoe u de importbron handmatig configureert.

  1. Voeg de module Gegevens importeren toe aan uw experiment. U vindt deze module in Studio (klassiek) in de categorie Gegevensinvoer en - uitvoer.

  2. Selecteer bij Gegevensbron de optie Azure SQL Database.

  3. Stel de volgende opties in die specifiek zijn Azure SQL Database of Azure SQL Data Warehouse.

    Naam van databaseserver: typ de servernaam die wordt gegenereerd door Azure. Deze heeft doorgaans de vorm <generated_identifier>.database.windows.net.

    Databasenaam: typ de naam van een bestaande database op de server die u zojuist hebt opgegeven.

    Servergebruikersaccountnaam: typ de gebruikersnaam van een account met toegangsrechten voor de database.

    Wachtwoord van servergebruikersaccount: geef het wachtwoord voor het opgegeven gebruikersaccount op.

    Databasequery: typ of plak een SQL-instructie die de gegevens beschrijft die u wilt lezen. Valideer altijd de SQL-instructie en controleer vooraf de queryresultaten met behulp van een hulpprogramma zoals Visual Studio Server Explorer of SQL Server Data Tools.

    Notitie

    De module Gegevens importeren ondersteunt alleen het invoeren van databasenaam, gebruikersnaam en wachtwoord als referenties.

  4. Als de gegevensset die u in het Machine Learning naar verwachting niet zal veranderen tussen de runs van het experiment, selecteert u de optie In cache opgeslagen resultaten gebruiken.

    Als dit is geselecteerd en er geen andere wijzigingen in de moduleparameters zijn, worden de gegevens door het experiment geladen wanneer de module voor het eerst wordt uitgevoerd. Daarna wordt een versie van de gegevensset in de cache gebruikt.

    Als u de gegevensset opnieuw wilt laden bij elke iteratie van het experiment, deselecteert u deze optie. De gegevensset wordt opnieuw geladen vanuit de bron telkens als parameters worden gewijzigd in Gegevens importeren.

  5. Voer het experiment uit.

    Omdat bij Gegevens importeren de gegevens in Studio (klassiek) worden geladen, kan er ook een impliciete typeconversie worden uitgevoerd, afhankelijk van de gegevenstypen die in de brondatabase worden gebruikt.

Resultaten

Wanneer het importeren is voltooid, klikt u op de uitvoergegevensset en selecteert u Visualiseren om te zien of de gegevens zijn geïmporteerd.

U kunt eventueel de gegevensset en de metagegevens ervan wijzigen met behulp van de hulpprogramma's in Studio (klassiek):

Voorbeelden

Zie de volgende artikelen en experimenten voor een voorbeeld van het gebruik van gegevens uit Azure-databases in machine learning:

  • Stap 1 van 6 voor het voorverwerken van gegevens: De sjabloon Voor retailprognoses illustreert een typisch scenario waarin gegevens worden gebruikt die zijn opgeslagen in Azure SQLDB voor analyse.

    Ook worden enkele nuttige technieken gedemonstreerd, zoals het gebruik van Azure SQLDB om gegevenssets tussen experimenten in verschillende accounts door te geven, prognoses op te slaan en te combineren en hoe u een Azure SQLDB voor machine learning.

  • Gebruik Machine Learning met SQL Data Warehouse: in dit artikel wordt gedemonstreerd hoe u een regressiemodel maakt om prijzen te voorspellen met behulp van Azure SQL Data Warehouse.

  • Azure-ML gebruiken met Azure SQL Data Warehouse: in dit artikel bouwt u een clusteringmodel op AdventureWorks met behulp van Gegevens importeren en Gegevens exporteren met Azure SQL Data Warehouse.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Veelgestelde vragen

Kan ik gegevens filteren terwijl deze uit de bron worden gelezen?

De module Gegevens importeren biedt geen ondersteuning voor filteren terwijl gegevens worden gelezen. U wordt aangeraden een weergave te maken of een query te definiëren die alleen de rijen genereert die u nodig hebt.

Notitie

Als u meer gegevens hebt geladen dan nodig is, kunt u de gegevensset in de cache overschrijven door een nieuwe gegevensset te lezen en deze op te slaan met dezelfde naam als de oudere, grotere gegevens.

Waarom krijg ik de fout 'Type Decimaal wordt niet ondersteund'?

Wanneer u gegevens leest uit SQL database, kan er een foutbericht worden weergegeven dat een niet-ondersteund gegevenstype rapporteert.

Als de gegevens die u uit de SQL-database op halen gegevenstypen bevatten die niet worden ondersteund in Machine Learning, moet u de decimalen casten of converteren naar een ondersteunde gegevens voordat u de gegevens leest. Gegevens importeren kan niet automatisch conversies uitvoeren die leiden tot verlies van precisie.

Zie Modulegegevenstypen voor meer informatie over ondersteunde gegevenstypen.

Wat gebeurt er als de database zich in een andere geografische regio. Heeft Het importeren van gegevens nog steeds toegang tot de database? Waar worden de gegevens opgeslagen?

Als de database zich in een andere regio dan het machine learning account, is de toegang tot gegevens mogelijk langzamer. Daarnaast worden er kosten in rekening gebracht voor in- en uit te gaan van gegevens in het abonnement als het reken knooppunt zich in een andere regio dan het opslagaccount.

Gegevens die u voor een experiment in uw werkruimte hebt gelezen, worden opgeslagen in het opslagaccount dat is gekoppeld aan het experiment.

Waarom worden sommige tekens niet correct weergegeven?

Machine Learning biedt ondersteuning voor UTF-8-codering. Als tekenreekskolommen in uw database een andere codering gebruiken, worden de tekens mogelijk niet correct geïmporteerd.

U kunt de gegevens exporteren naar een CSV-bestand in Azure Storage en de optie CSV met codering gebruiken om parameters op te geven voor aangepaste scheidingstekens, de codepagina, enzovoort.

Moduleparameters

Name Bereik Type Standaard Beschrijving
Gegevensbron Lijst Gegevensbron of sink Azure Blob Storage De gegevensbron kan HTTP, FTP, anonieme HTTPS of FTPS zijn, een bestand in Azure BLOB Storage, een Azure-tabel, een Azure SQL Database, een on-premises SQL Server-database, een Hive-tabel of een OData-eindpunt.
URI van HDFS-server alle Tekenreeks geen HDFS-rest-eindpunt
Databaseservernaam alle Tekenreeks geen Naam van het Microsoft Azure Storage-account
Databasenaam alle SecureString geen Azure-opslagsleutel
Servergebruikersaccountnaam alle Tekenreeks geen Azure-containernaam
Servergebruikersaccountnaam Lijst (subset) URL-inhoud OData Gegevensindelingstype
Databasequery alle Tekenreeks geen Gegevensindelingstype
Resultaten in cache gebruiken TRUE/FALSE Booleaans FALSE beschrijving

Uitvoerwaarden

Naam Type Description
Gegevensset met resultaten Gegevenstabel Gegevensset met gedownloade gegevens

Uitzonderingen

Uitzondering Description
Fout 0027 Er treedt een uitzondering op wanneer twee objecten dezelfde grootte moeten hebben, maar niet.
Fout 0003 Er treedt een uitzondering op als een of meer invoer null of leeg zijn.
Fout 0029 Er treedt een uitzondering op wanneer een ongeldige URI wordt doorgegeven.
Fout 0030 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te downloaden.
Fout 0002 Er treedt een uitzondering op als een of meer parameters niet kunnen worden geparseerd of geconverteerd van het opgegeven type naar het type dat is vereist voor de doelmethode.
Fout 0009 Er treedt een uitzondering op als de naam van het Azure-opslagaccount of de containernaam onjuist is opgegeven.
Fout 0048 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te openen.
Fout 0015 Er treedt een uitzondering op als de databaseverbinding is mislukt.
Fout 0046 Er treedt een uitzondering op wanneer het niet mogelijk is om een map te maken op het opgegeven pad.
Fout 0049 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te parseren.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Gegevens importeren
Gegevens exporteren
Importeren vanuit een web-URL via HTTP
Importeren vanuit Hive-query
Importeren uit Azure Table
Importeren vanuit Azure Blob Storage
Importeren vanuit gegevensfeedproviders
Importeren vanuit on-premises SQL Server database