Delen via


Exporteren naar Azure SQL Database

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel wordt beschreven hoe u de optie Exporteren naar Azure SQL Database in de module Gegevens exporteren in Machine Learning Studio (klassiek). Deze optie is handig als u gegevens wilt exporteren van uw machine learning experiment naar een Azure SQL Database of Azure SQL Data Warehouse.

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Exporteren naar een SQL-database is handig in veel machine learning-scenario's: u wilt bijvoorbeeld tussenliggende resultaten opslaan, scores opslaan of tabellen met ontworpen functies persistent maken. Hoewel het opslaan van gegevens in een Azure SQL Database of Azure SQL Data Warehouse duurder kan zijn dan het gebruik van tabellen of blobs in Azure, zijn er geen transactiekosten voor SQL databases. Bovendien is databaseopslag ideaal voor het snel schrijven van kleinere hoeveelheden veelgebruikte informatie, voor het delen van gegevens tussen experimenten of voor het rapporteren van resultaten, voorspellingen en metrische gegevens.

Aan de andere kant kunnen er limieten zijn voor de hoeveelheid gegevens die u in een database kunt opslaan, afhankelijk van uw abonnementstype. U moet ook overwegen om een database en account te gebruiken die zich in dezelfde regio als uw machine learning werkruimte.

Als u gegevens wilt exporteren, geeft u de naam van het exemplaar en de database op waar de gegevens zijn opgeslagen. Voer de module uit met behulp van een account met schrijfmachtigingen. U moet ook de tabelnaam opgeven en de kolommen uit uw experiment aan kolommen in de tabel toevoegen.

Gegevens exporteren naar een Azure SQL Database

  1. Voeg de module Gegevens exporteren toe aan uw experiment in Studio (klassiek). U vindt deze module in de categorie Gegevensinvoer en -uitvoer.

  2. Verbinding maken Gegevens exporteren naar de module die de gegevens produceert die u wilt exporteren.

  3. Selecteer bij Gegevensdoel de optie Azure SQL Database. Deze optie ondersteunt Azure SQL Data Warehouse ook.

  4. Geef de naam op van de server en database in Azure SQL Database of Azure SQL Data Warehouse.

    Databaseservernaam: typ de servernaam zoals deze is gegenereerd door Azure. Deze heeft doorgaans de vorm <generated_identifier>.database.windows.net.

    Databasenaam: typ de naam van een bestaande database op de server die u zojuist hebt opgegeven. De module Gegevens exporteren kan geen database maken.

    Servergebruikersaccountnaam: typ de gebruikersnaam voor een account met toegangsrechten voor de database.

    Wachtwoord van servergebruikersaccount: geef het wachtwoord voor het opgegeven gebruikersaccount op.

  5. Geef de kolommen op die u wilt exporteren en als u de naam van de kolommen wilt wijzigen.

    Door komma's gescheiden lijst met kolommen die moeten worden opgeslagen: typ de namen van de kolommen uit het experiment dat u naar de database wilt schrijven.

    Naam van gegevenstabel: typ de naam van de tabel waarin de gegevens moeten worden opgeslagen.

    Als Azure SQL Database tabel niet bestaat, wordt er bijvoorbeeld een nieuwe tabel gemaakt.

    Voor Azure SQL Data Warehouse moet de tabel al bestaan en het juiste schema hebben. Zorg er daarom voor dat u deze vooraf maakt.

    Door komma's gescheiden lijst met gegevenstabelkolommen: typ de namen van de kolommen zoals u wilt dat deze in de doeltabel worden weergegeven.

    U Azure SQL Database bijvoorbeeld de kolomnamen wijzigen, maar u moet de kolommen in dezelfde volgorde houden als de kolommen die u voor export hebt vermeld, in de door komma's gescheiden lijst met kolommen die moeten worden opgeslagen.

    Voor Azure SQL Data Warehouse moeten de namen van kolommen overeenkomen met de namen die al in het doeltabelschema staan.

  6. Aantal rijen dat per SQL Azure geschreven: met deze optie geeft u op hoeveel rijen in elke batch naar de doeltabel moeten worden geschreven.

    De waarde is standaard ingesteld op 50. Dit is de standaardbatchgrootte voor Azure SQL Database. U moet deze waarde echter verhogen als u een groot aantal rijen hebt om te schrijven.

    Voor Azure SQL Data Warehouse raden we u aan deze waarde in te stellen op 1. Als u een grotere batch gebruikt, kan de grootte van de opdrachtreeks die wordt verzonden naar Azure SQL Data Warehouse de toegestane tekenreekslengte overschrijden, waardoor er een fout wordt veroorzaakt.

  7. Resultaten in cache gebruiken: selecteer deze optie om te voorkomen dat er telkens nieuwe resultaten worden geschreven als het experiment wordt uitgevoerd. Als er geen andere wijzigingen in moduleparameters zijn, schrijft het experiment de gegevens alleen wanneer de module voor het eerst wordt uitgevoerd. Er wordt echter altijd een nieuwe schrijfing uitgevoerd als er parameters zijn gewijzigd in Gegevens exporteren die de resultaten zouden wijzigen.

  8. Voer het experiment uit.

Voorbeelden

Zie de volgende informatie voor voorbeelden van het gebruik van de module Azure AI Gallery:

  • Stap 1 van 6 voor retailprognose: de sjabloon voor retailprognoses illustreert een machine learning-taak op basis van gegevens die zijn opgeslagen in Azure SQLDB. Het toont nuttige technieken, zoals het gebruik van Azure SQL-database om gegevenssets tussen experimenten in verschillende accounts door te geven, prognoses op te slaan en te combineren en hoe u een Azure SQL-database alleen voor machine learning.

  • Een machine learning-model bouwen en implementeren met behulp van SQL Server op een Azure-VM: In dit artikel wordt beschreven hoe u een SQL Server-database die wordt gehost op een Azure-VM gebruikt als bron voor het opslaan van trainingsgegevens en voorspellingen. Het laat ook zien hoe relationele databases kunnen worden gebruikt voor feature engineering selectie van functies.

  • Azure-ML gebruiken met Azure SQL Data Warehouse: demonstreert het gebruik van gegevens uit Azure SQL Data Warehouse om een clusteringmodel te bouwen.

  • Gebruik Machine Learning met SQL Data Warehouse: demonstreert hoe u een regressiemodel maakt om prijzen te voorspellen met behulp van gegevens in Azure SQL Data Warehouse.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Veelgestelde vragen

Een database in een andere geografische regio gebruiken

Als de Azure SQL Database of SQL Data Warehouse zich in een andere regio dan het machine learning account, kunnen schrijf schrijfgegevens langzamer zijn.

Er worden ook kosten in rekening gebracht voor in- en uittreding van gegevens in het abonnement als het reken knooppunt zich in een andere regio dan het opslagaccount belandt.

Waarom worden sommige tekens in de uitvoergegevens niet correct weergegeven?

Machine Learning ondersteunt UTF-8-codering. Als tekenreekskolommen in uw database een andere codering gebruiken, worden de tekens mogelijk niet correct opgeslagen.

Bovendien kunnen Machine Learning gegevenstypen zoals niet worden uitgevoerdmoney.

Moduleparameters

Name Bereik Type Standaard Beschrijving
Gegevensbron Lijst Gegevensbron of sink Azure Blob Storage De gegevensbron kan HTTP, FTP, anonieme HTTPS of FTPS zijn, een bestand in Azure BLOB Storage, een Azure-tabel, een Azure SQL Database of Azure SQL Data Warehouse, een Hive-tabel of een OData-eindpunt.
Databaseservernaam alle Tekenreeks geen
Databasenaam alle Tekenreeks geen
Servergebruikersaccountnaam alle Tekenreeks geen
Wachtwoord van servergebruikersaccount geen
Door komma's gescheiden lijst met kolommen die moeten worden opgeslagen geen
Naam van gegevenstabel alle Tekenreeks geen
Door komma's gescheiden lijst met gegevenstabelkolommen Tekenreeks Tekenreeks geen Tekenreeks
Aantal geschreven rijen per SQL Azure bewerking Tekenreeks Geheel getal 50 Tekenreeks
Resultaten in cache gebruiken TRUE/FALSE Booleaans FALSE Module wordt alleen uitgevoerd als er geen geldige cache bestaat; gebruik anders gegevens uit eerdere uitvoering in de cache.

Uitzonderingen

Uitzondering Description
Fout 0027 Er treedt een uitzondering op wanneer twee objecten dezelfde grootte moeten hebben, maar niet.
Fout 0003 Er treedt een uitzondering op als een of meer invoer null of leeg zijn.
Fout 0029 Er treedt een uitzondering op wanneer een ongeldige URI wordt doorgegeven.
Fout 0030 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te downloaden.
Fout 0002 Er treedt een uitzondering op als een of meer parameters niet kunnen worden geparseerd of geconverteerd van het opgegeven type naar het type dat is vereist voor de doelmethode.
Fout 0009 Er treedt een uitzondering op als de naam van het Azure-opslagaccount of de containernaam onjuist is opgegeven.
Fout 0048 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te openen.
Fout 0015 Er treedt een uitzondering op als de databaseverbinding is mislukt.
Fout 0046 Er treedt een uitzondering op wanneer het niet mogelijk is om een map te maken op het opgegeven pad.
Fout 0049 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te parseren.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Gegevens importeren
Gegevens exporteren
Exporteren naar Azure Blob Storage
Exporteren naar Hive-query
Exporteren naar Azure Table