Importeren vanuit on-premises SQL Server database

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel wordt beschreven hoe u de module Gegevens importeren in Machine Learning Studio (klassiek) gebruikt om gegevens uit een on-premises SQL Server-database te importeren in een machine learning experiment.

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Machine Learning hebt toegang tot een on-premises SQL Server database als de gegevens worden verstrekt met behulp van een Microsoft Gegevensbeheer Gateway. Daarom moet u voldoen aan de volgende vereisten voordat u Gegevens importeren gebruikt:

Nadat de gatewayverbinding tot stand is gebracht, kunt u aanvullende eigenschappen opgeven, zoals de server- en databasenamen, verificatiemethode en een databasequery.

Een Microsoft Gegevensbeheer-gateway installeren

Als u toegang wilt krijgen tot een on-premises SQL Server-database in Machine Learning, moet u de Microsoft Gegevensbeheer Gateway downloaden en installeren en vervolgens de gateway registreren in Machine Learning Studio (klassiek).

Zie de volgende artikelen voor meer informatie over het installeren en registreren van de gateway:

Gegevens importeren uit een on-premises SQL Server database

Nadat een Gegevensbeheer-gateway is geïnstalleerd op een computer waarop deze toegang heeft tot uw SQL Server-database en u de gateway hebt geregistreerd in Machine Learning Studio (klassiek), moet u de module Gegevens importeren configureren.

Voordat u begint, schakelt u de pop-upblokkering van uw browser uit voor de site, studio.azureml.net.

Als u de Google Chrome-browser gebruikt, moet u een van de in plug-ins downloaden en installeren die beschikbaar zijn in de Google Chrome WebStore: klik op Eenmaal app-extensie.

De wizard Gegevens importeren gebruiken

De module bevat een nieuwe wizard om u te helpen een opslagoptie te kiezen, een keuze te maken uit bestaande abonnementen en accounts en snel alle opties te configureren.

  1. Voeg de module Gegevens importeren toe aan uw experiment. U vindt de module in Studio (klassiek) in de categorie Gegevensinvoer en -uitvoer.

  2. Klik op Wizard Gegevens importeren starten en volg de aanwijzingen.

  3. Wanneer de configuratie is voltooid, kopieert u de gegevens daadwerkelijk naar uw experiment, klikt u met de rechtermuisknop op de module en selecteert u Geselecteerde uitvoeren.

Als u een bestaande gegevensverbinding wilt bewerken, laadt de wizard alle eerdere configuratiegegevens, zodat u niet opnieuw opnieuw hoeft te beginnen.

Handmatig eigenschappen instellen in de module Gegevens importeren

  1. Voeg de module Gegevens importeren toe aan uw experiment. U vindt de module in Studio (klassiek) in de categorie Gegevensinvoer en -uitvoer.

  2. Bij Gegevensbron selecteert u On-Premises SQL Database.

  3. Stel de volgende opties in die specifiek zijn voor SQL Server database.

    • Gegevensgateway: selecteer de gateway die u hebt gemaakt. De gateway moet zijn geregistreerd of wordt niet weergegeven in de lijst.

    • Naam van databaseserver: typ de naam van het SQL Server exemplaar.

    • Databasenaam: typ de naam van de database.

    • Klik op Waarden invoerenonder Gebruikersnaam en wachtwoord en voer uw databasereferenties in. U kunt geïntegreerde Windows of SQL Server gebruiken, afhankelijk van hoe uw on-premises SQL Server is geconfigureerd.

      Belangrijk

      Het referentiebeheer moet worden gestart vanuit hetzelfde netwerk als het SQL Server-exemplaar en de gatewayclient. Referenties kunnen niet worden doorgegeven in meerdere domeinen.

    • Typ of plak in Databasequery een SQL waarin de gegevens worden beschreven die u wilt lezen. Valideer altijd de SQL-instructie en controleer vooraf de queryresultaten met behulp van een hulpprogramma zoals Visual Studio Server Explorer of SQL Server Data Tools.

    • Als de gegevensset naar verwachting niet verandert tussen de runs van het experiment, selecteert u de optie In cache opgeslagen resultaten gebruiken. Als deze optie is geselecteerd en er geen andere wijzigingen in de moduleparameters zijn, worden de gegevens door het experiment geladen wanneer de module voor het eerst wordt uitgevoerd. Daarna wordt een versie van de gegevensset in de cache gebruikt.

  4. Voer het experiment uit.

Resultaten

Als bij Gegevens importeren de gegevens in Studio (klassiek) worden geladen, kan er een impliciete typeconversie worden uitgevoerd, afhankelijk van de gegevenstypen die in de brondatabase worden gebruikt. Zie Modulegegevenstypen voor meer informatie over gegevenstypen.

Wanneer u klaar bent, klikt u op de uitvoergegevensset en selecteert u Visualiseren om te zien of de gegevens zijn geïmporteerd.

U kunt eventueel de gegevensset en de metagegevens ervan wijzigen met behulp van de hulpprogramma's in Studio (klassiek):

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Veelgestelde vragen

Kan ik gegevens filteren terwijl deze uit de bron worden gelezen?

De module Gegevens importeren zelf biedt geen ondersteuning voor filteren wanneer gegevens worden gelezen. U wordt aangeraden een weergave te maken of een query te definiëren die alleen de rijen genereert die u nodig hebt.

Notitie

Als u meer gegevens hebt geladen dan nodig is, kunt u de gegevensset in de cache overschrijven door een nieuwe gegevensset te lezen en deze op te slaan met dezelfde naam als de oudere, grotere gegevens.

Waarom krijg ik de fout 'Type Decimaal wordt niet ondersteund'

Wanneer u gegevens leest uit SQL database, kan er een foutbericht worden weergegeven dat een niet-ondersteund gegevenstype rapporteert.

Als de gegevens die u uit de SQL-database op halen gegevenstypen bevatten die niet worden ondersteund in Machine Learning, moet u de decimalen casten of converteren naar een ondersteund gegevenstype voordat u de gegevens leest. De reden hiervoor is dat Import Data niet automatisch conversies kan uitvoeren die zouden leiden tot verlies van precisie.

Waarom worden sommige tekens niet correct weergegeven?

Machine Learning biedt ondersteuning voor UTF-8-codering. Als tekenreekskolommen in uw database een andere codering gebruiken, worden de tekens mogelijk niet correct geïmporteerd.

U kunt deze tekens behouden door de gegevens te exporteren naar een CSV-bestand in Azure Storage en de optie CSV met codering te gebruiken om parameters op te geven voor aangepaste scheidingstekens, de codepagina, enzovoort.

Ik heb een Gegevensbeheer gateway ingesteld op mijn on-premises server. Kan ik dezelfde gateway delen tussen werkruimten?

Nee. U moet voor elke werkruimte een afzonderlijke gateway maken.

Hoewel u meerdere Gegevensbeheer-gateways in één werkruimte kunt instellen (bijvoorbeeld één voor ontwikkeling, testen, productie, enzovoort), kan een gateway niet worden gedeeld tussen werkruimten.

Ik heb een Gegevensbeheer-gateway ingesteld op mijn on-premises server die ik voor Power BI of Azure Data Factory gebruik en wil dezelfde gateway gebruiken voor Machine Learning

Voor elke service is een afzonderlijke Gegevensbeheer gateway vereist. Als u al een gateway hebt die wordt gebruikt voor Power BI of Azure Data Factory, moet u een afzonderlijke server instellen en een gateway installeren voor machine learning.

U kunt niet meerdere gateways op één server installeren.

Ik wil gegevens kunnen exporteren naar mijn on-premises SQL server. Kan ik de gateway met de module Gegevens exporteren gebruiken om gegevens naar mijn on-premises SQL schrijven?

Momenteel ondersteunt Machine Learning alleen het importeren van gegevens. We evalueren of u in de toekomst naar uw on-premises database kunt schrijven. In de tussentijd kunt u Azure Data Factory gegevens uit de cloud naar uw on-premises database kopiëren.

Ik heb een gegevensbron die niet Microsoft SQL Server (Oracle, Teradata, enzovoort). Kan ik de gegevens in Machine Learning met behulp van de on-premises optie in de module Gegevens importeren?

Momenteel ondersteunt Machine Learning module Import Data alleen Microsoft SQL Server.

Als tijdelijke oplossing kunt u Azure Data Factory gebruiken om uw on-premises gegevens te kopiëren naar cloudopslag, zoals Azure Blob Storage of Azure Database, en vervolgens uw cloudgegevensbron gebruiken in de module Gegevens importeren.

Moduleparameters

Name Bereik Type Standaard Beschrijving
Gegevensbron Lijst Gegevensbron of sink Azure Blob Storage De gegevensbron kan HTTP, FTP, anonieme HTTPS of FTPS zijn, een bestand in Azure BLOB Storage, een Azure-tabel, een Azure SQL Database, een on-premises SQL Server-database, een Hive-tabel of een OData-eindpunt.
Gegevensgateway alle DataGatewayName geen Naam van gegevensgateway
Databaseservernaam alle Tekenreeks geen On-premises SQL Server
Databasenaam alle Tekenreeks geen On-premises SQL Server database-exemplaar
Gebruikersnaam en wachtwoord alle SecureString geen Gebruikersnaam en wachtwoord
Databasequery alle StreamReader geen On-premises SQL query

Uitvoerwaarden

Naam Type Description
Gegevensset met resultaten Gegevenstabel Gegevensset met gedownloade gegevens

Uitzonderingen

Uitzondering Description
Fout 0027 Er treedt een uitzondering op wanneer twee objecten dezelfde grootte moeten hebben, maar dat niet zijn.
Fout 0003 Een uitzondering treedt op als een of meer invoer null of leeg zijn.
Fout 0029 Er treedt een uitzondering op wanneer een ongeldige URI wordt doorgegeven.
Fout 0030 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te downloaden.
Fout 0002 Er treedt een uitzondering op als een of meer parameters niet kunnen worden geparseerd of geconverteerd van het opgegeven type naar het type dat is vereist door de doelmethode.
Fout 0048 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te openen.
Fout 0015 Er treedt een uitzondering op als de databaseverbinding is mislukt.
Fout 0046 Er treedt een uitzondering op wanneer het niet mogelijk is om een map te maken op het opgegeven pad.
Fout 0049 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te parseren.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Gegevens importeren
Gegevens exporteren
Importeren vanuit een web-URL via HTTP
Importeren vanuit Hive-query
Importeren vanuit een Azure SQL Database
Importeren vanuit Azure Table
Importeren vanuit Azure Blob Storage
Importeren vanuit gegevensfeedproviders