Delen via


Gegevens exporteren

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

Schrijft een gegevensset naar verschillende vormen van cloudopslag in Azure, zoals tabellen, blobs en Azure SQL databases

Categorie: Gegevensinvoer en -uitvoer

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Moduleoverzicht

In dit artikel wordt beschreven hoe u de module Gegevens exporteren in Machine Learning Studio (klassiek) gebruikt om resultaten, tussenliggende gegevens en werkende gegevens van uw experimenten op te slaan in cloudopslagbestemmingen buiten Machine Learning Studio (klassiek).

Deze module ondersteunt het exporteren of opslaan van uw gegevens naar de volgende cloudgegevensservices:

  • Exporteren naar Hive-query: schrijf gegevens naar een Hive-tabel in een HDInsight Hadoop-cluster.

  • Exporteren naar Azure SQL Database: Sla gegevens op in Azure SQL Database of Azure SQL Data Warehouse.

  • Exporteren naar Azure Table: Sla gegevens op in de Table Storage-service in Azure. Table Storage is goed voor het opslaan van grote hoeveelheden gegevens. Het biedt een tabellaire indeling die schaalbaar, goedkoop en zeer beschikbaar is.

  • Exporteren naar Azure Blob Storage: slaat gegevens op in de Blob service in Azure. Deze optie is handig voor afbeeldingen, ongestructureerde tekst of binaire gegevens. Gegevens in de Blob service kunnen openbaar worden gedeeld of worden opgeslagen in beveiligde toepassingsgegevensopslag.

Notitie

De module Gegevens exporteren biedt geen ondersteuning voor het maken van verbinding met een Azure Blob Storage-account als de optie Veilige overdracht vereist is ingeschakeld.

  • Gegevens downloaden: Als u uw gegevens wilt downloaden zodat u deze kunt openen in Excel of een andere toepassing, gebruikt u een module zoals Converteren naar CSV of Converteren naar TSV om de gegevens in een bepaalde indeling voor te bereiden en vervolgens de gegevens te downloaden.

  • U kunt de resultaten downloaden van een module die een gegevensset als uitvoer heeft door met de rechtermuisknop op de uitvoer te klikken en Gegevensset downloaden te selecteren. De gegevens worden standaard geëxporteerd in CSV-indeling.

  • Download een moduledefinitie of experimentgrafiek: Met een nieuwe PowerShell-bibliotheek kunt u de volledige metagegevens voor uw experiment of de details voor een bepaalde module downloaden. De PowerShell voor Machine Learning-bibliotheek is een experimentele release, maar heeft veel nuttige cmdlets:

    • Get-AmlExperiment geeft een lijst weer van alle experimenten in een werkruimte.
    • Export-AmlExperimentGraph exporteert een definitie van het volledige experiment naar een JSON-bestand.
    • Download-AmlExperimentNodeOutput hiermee kunt u de informatie extraheren die is opgegeven op de uitvoerpoorten van een module.

Gegevens exporteren configureren

  1. Voeg de module Gegevens exporteren toe aan uw experiment in Studio (klassiek). U vindt deze module in de categorie Invoer en uitvoer.

  2. Verbinding maken Gegevens exporteren naar de module die de gegevens bevat die u wilt exporteren.

  3. Dubbelklik op Gegevens exporteren om het deelvenster Eigenschappen te openen.

  4. Selecteer bij Gegevensbestemming het type cloudopslag waarin u uw gegevens wilt opslaan. Als u deze optie wijzigt, worden alle andere eigenschappen opnieuw ingesteld. Zorg er daarom voor dat u eerst deze optie kiest.

  5. Geef een accountnaam en verificatiemethode op die vereist zijn voor toegang tot het opgegeven opslagaccount.

    Afhankelijk van het opslagtype en of het account is beveiligd, moet u mogelijk de accountnaam, het bestandstype, de toegangssleutel of de containernaam verstrekken. Voor bronnen waarvoor geen verificatie is vereist, is het over het algemeen voldoende om de URL te kennen.

    Zie de volgende onderwerpen voor voorbeelden van elk type:

  6. Met de optie In cache opgeslagen resultaten gebruiken kunt u het experiment herhalen zonder telkens dezelfde resultaten te herschrijven.

    Als u deze optie deselecteert, worden de resultaten telkens wanneer het experiment wordt uitgevoerd naar de opslag geschreven, ongeacht of de uitvoergegevens zijn gewijzigd.

    Als u deze optie selecteert, maakt Gegevens exporteren gebruik van gegevens in de cache, indien beschikbaar. Nieuwe resultaten worden alleen gegenereerd wanneer er een upstream-wijziging is die van invloed is op de resultaten.

  7. Voer het experiment uit.

Voorbeelden

Zie de volgende informatie voor voorbeelden van het gebruik van de module Azure AI Gallery:

  • Tekstclassificatie: In dit voorbeeld wordt Gebruikgemaakt van Gegevens exporteren om tussenliggende resultaten op te slaan en gebruikt vervolgens Gegevens importeren om ze uit de opslag op te halen voor latere stappen in het experiment.

  • Stap 1 van 6 voor het voorverwerken van gegevens: de sjabloon voor retailprognoses illustreert een machine learning-taak op basis van gegevens die zijn opgeslagen in Azure SQL Database. Het laat verschillende nuttige technieken zien, zoals het maken van een Azure SQL-database voor machine learning, met behulp van de Azure SQL-database om gegevenssets tussen experimenten in verschillende accounts door te geven en prognoses op te slaan en te combineren.

  • Een machine learning-model bouwen en implementeren met behulp van SQL Server op een Azure-VM: in dit artikel wordt gedemonstreerd hoe u een SQL Server-database die wordt gehost op een Azure-VM kunt gebruiken als bron voor het opslaan van trainingsgegevens en de voorspellingen die door het experiment worden gegenereerd. Het laat ook zien hoe relationele databases kunnen worden gebruikt voor feature engineering selectie van functies en functies.

  • Azure-ML gebruiken met Azure SQL Data Warehouse: in dit artikel wordt beschreven hoe u een machine learning-model kunt maken met behulp van gegevens in Azure SQL Data Warehouse.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Implementatiegegevens

  • Deze module heette voorheen Writer. Als u een bestaand experiment hebt dat gebruikmaakt van de Writer-module , wordt de naam van de module gewijzigd in Gegevens exporteren wanneer u het experiment vernieuwt.

  • Niet alle modules produceren uitvoer die compatibel is met exportgegevensbestemmingen . Gegevens exporteren kan bijvoorbeeld geen gegevensset opslaan die is geconverteerd naar de SVMLight-indeling. Gegevens exporteren ondersteunt deze indelingen:

    • Gegevensset (interne ML Azure)
    • .NET DataTable
    • CSV met of zonder headers
    • TSV met of zonder headers

Bekende problemen

  • Wanneer u Azure Table selecteert als de locatie voor het uitvoeren van uw gegevens, kan er af en toe een fout zijn opgetreden bij het schrijven naar de opgegeven tabel. Als dit gebeurt, worden de gegevens mogelijk naar een blob geschreven.

    Als deze fout zich voordeed en u later niet meer kunt lezen uit de verwachte tabel, kunt u proberen een Azure Storage-hulpprogramma te gebruiken om de blobs in de opgegeven container in uw opslagaccount te controleren.

  • Op dit moment kunt u een blob niet opslaan in een opgegeven Hive-tabel. Als u tussenliggende resultaten wilt schrijven, vermijdt u het gebruik van een Hive-tabel in HDInsight en gebruikt u in plaats daarvan blobopslag of tabelopslag.

  • Als u momenteel HDFS selecteert als de locatie om uitvoergegevens op te slaan, wordt dit foutbericht geretourneerd: Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException.

Verwachte invoer

Naam Type Description
Gegevensset Gegevenstabel De gegevensset die moet worden geschreven.

Moduleparameters

Deze tabel bevat parameters die van toepassing zijn op alle opties voor het exporteren van gegevens. Andere parameters zijn dynamisch en veranderen afhankelijk van de gegevensbestemming die u selecteert.

Name Bereik Type Standaard Beschrijving
Geef de gegevensbestemming op Lijst DataSourceOrSink Blob service in Azure Storage Geef aan of de gegevensbestemming een bestand in de Blob service is, een bestand in de Tabelservice, een SQL-database in Azure of een Hive-tabel.
Resultaten in cache gebruiken TRUE/FALSE Booleaans FALSE Selecteer deze optie om te voorkomen dat resultaten onnodig worden herschreven. Als er upstream wijzigingen worden aangebracht in het experiment, worden met Gegevens exporteren altijd nieuwe resultaten uitgevoerd en geschreven. Als er echter niets is gewijzigd en u deze optie hebt geselecteerd, wordt Gegevens exporteren niet uitgevoerd om te voorkomen dat dezelfde resultaten worden herschreven.

Uitzonderingen

Uitzondering Description
Fout 0057 Er treedt een uitzondering op wanneer u probeert een bestand of blob te maken die al bestaat.
Fout 0001 Er treedt een uitzondering op als een of meer opgegeven kolommen van de gegevensset niet kunnen worden gevonden.
Fout 0027 Er treedt een uitzondering op wanneer twee objecten dezelfde grootte moeten hebben, maar niet.
Fout 0079 Er treedt een uitzondering op als de containernaam in Azure Storage onjuist is opgegeven.
Fout 0052 Er treedt een uitzondering op als de toegangssleutel voor opslag voor het Azure-account onjuist is opgegeven.
Fout 0064 Er treedt een uitzondering op als de accountnaam of opslagtoegangssleutel voor het Azure-account onjuist is opgegeven.
Fout 0071 Er treedt een uitzondering op als de opgegeven referenties onjuist zijn.
Fout 0018 Er treedt een uitzondering op als de invoerset ongeldig is.
Fout 0029 Er treedt een uitzondering op wanneer een ongeldige URI wordt doorgegeven.
Fout 0003 Er treedt een uitzondering op als een of meer invoer null of leeg zijn.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Gegevens importeren
Gegevensinvoer en -uitvoer
Gegevenstransformatie
Azure Table-Storage en Azure SQL Database
Lijst met A-Z-modules