Gegevens exporteren
Belangrijk
De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.
Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.
- Zie informatie over het verplaatsen machine learning van ML Studio (klassiek) naar Azure Machine Learning.
- Meer informatie over Azure Machine Learning.
De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.
Schrijft een gegevensset naar verschillende vormen van cloudopslag in Azure, zoals tabellen, blobs en Azure SQL databases
Categorie: Gegevensinvoer en -uitvoer
Notitie
Van toepassing op: Machine Learning Studio (klassiek)
Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.
Moduleoverzicht
In dit artikel wordt beschreven hoe u de module Gegevens exporteren in Machine Learning Studio (klassiek) gebruikt om resultaten, tussenliggende gegevens en werkende gegevens van uw experimenten op te slaan in cloudopslagbestemmingen buiten Machine Learning Studio (klassiek).
Deze module ondersteunt het exporteren of opslaan van uw gegevens naar de volgende cloudgegevensservices:
Exporteren naar Hive-query: schrijf gegevens naar een Hive-tabel in een HDInsight Hadoop-cluster.
Exporteren naar Azure SQL Database: Sla gegevens op in Azure SQL Database of Azure SQL Data Warehouse.
Exporteren naar Azure Table: Sla gegevens op in de Table Storage-service in Azure. Table Storage is goed voor het opslaan van grote hoeveelheden gegevens. Het biedt een tabellaire indeling die schaalbaar, goedkoop en zeer beschikbaar is.
Exporteren naar Azure Blob Storage: slaat gegevens op in de Blob service in Azure. Deze optie is handig voor afbeeldingen, ongestructureerde tekst of binaire gegevens. Gegevens in de Blob service kunnen openbaar worden gedeeld of worden opgeslagen in beveiligde toepassingsgegevensopslag.
Notitie
De module Gegevens exporteren biedt geen ondersteuning voor het maken van verbinding met een Azure Blob Storage-account als de optie Veilige overdracht vereist is ingeschakeld.
Gerelateerde taken
Gegevens downloaden: Als u uw gegevens wilt downloaden zodat u deze kunt openen in Excel of een andere toepassing, gebruikt u een module zoals Converteren naar CSV of Converteren naar TSV om de gegevens in een bepaalde indeling voor te bereiden en vervolgens de gegevens te downloaden.
U kunt de resultaten downloaden van een module die een gegevensset als uitvoer heeft door met de rechtermuisknop op de uitvoer te klikken en Gegevensset downloaden te selecteren. De gegevens worden standaard geëxporteerd in CSV-indeling.
Download een moduledefinitie of experimentgrafiek: Met een nieuwe PowerShell-bibliotheek kunt u de volledige metagegevens voor uw experiment of de details voor een bepaalde module downloaden. De PowerShell voor Machine Learning-bibliotheek is een experimentele release, maar heeft veel nuttige cmdlets:
Get-AmlExperiment
geeft een lijst weer van alle experimenten in een werkruimte.Export-AmlExperimentGraph
exporteert een definitie van het volledige experiment naar een JSON-bestand.Download-AmlExperimentNodeOutput
hiermee kunt u de informatie extraheren die is opgegeven op de uitvoerpoorten van een module.
Gegevens exporteren configureren
Voeg de module Gegevens exporteren toe aan uw experiment in Studio (klassiek). U vindt deze module in de categorie Invoer en uitvoer.
Verbinding maken Gegevens exporteren naar de module die de gegevens bevat die u wilt exporteren.
Dubbelklik op Gegevens exporteren om het deelvenster Eigenschappen te openen.
Selecteer bij Gegevensbestemming het type cloudopslag waarin u uw gegevens wilt opslaan. Als u deze optie wijzigt, worden alle andere eigenschappen opnieuw ingesteld. Zorg er daarom voor dat u eerst deze optie kiest.
Geef een accountnaam en verificatiemethode op die vereist zijn voor toegang tot het opgegeven opslagaccount.
Afhankelijk van het opslagtype en of het account is beveiligd, moet u mogelijk de accountnaam, het bestandstype, de toegangssleutel of de containernaam verstrekken. Voor bronnen waarvoor geen verificatie is vereist, is het over het algemeen voldoende om de URL te kennen.
Zie de volgende onderwerpen voor voorbeelden van elk type:
Met de optie In cache opgeslagen resultaten gebruiken kunt u het experiment herhalen zonder telkens dezelfde resultaten te herschrijven.
Als u deze optie deselecteert, worden de resultaten telkens wanneer het experiment wordt uitgevoerd naar de opslag geschreven, ongeacht of de uitvoergegevens zijn gewijzigd.
Als u deze optie selecteert, maakt Gegevens exporteren gebruik van gegevens in de cache, indien beschikbaar. Nieuwe resultaten worden alleen gegenereerd wanneer er een upstream-wijziging is die van invloed is op de resultaten.
Voer het experiment uit.
Voorbeelden
Zie de volgende informatie voor voorbeelden van het gebruik van de module Azure AI Gallery:
Tekstclassificatie: In dit voorbeeld wordt Gebruikgemaakt van Gegevens exporteren om tussenliggende resultaten op te slaan en gebruikt vervolgens Gegevens importeren om ze uit de opslag op te halen voor latere stappen in het experiment.
Stap 1 van 6 voor het voorverwerken van gegevens: de sjabloon voor retailprognoses illustreert een machine learning-taak op basis van gegevens die zijn opgeslagen in Azure SQL Database. Het laat verschillende nuttige technieken zien, zoals het maken van een Azure SQL-database voor machine learning, met behulp van de Azure SQL-database om gegevenssets tussen experimenten in verschillende accounts door te geven en prognoses op te slaan en te combineren.
Een machine learning-model bouwen en implementeren met behulp van SQL Server op een Azure-VM: in dit artikel wordt gedemonstreerd hoe u een SQL Server-database die wordt gehost op een Azure-VM kunt gebruiken als bron voor het opslaan van trainingsgegevens en de voorspellingen die door het experiment worden gegenereerd. Het laat ook zien hoe relationele databases kunnen worden gebruikt voor feature engineering selectie van functies en functies.
Azure-ML gebruiken met Azure SQL Data Warehouse: in dit artikel wordt beschreven hoe u een machine learning-model kunt maken met behulp van gegevens in Azure SQL Data Warehouse.
Technische opmerkingen
Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.
Implementatiegegevens
Deze module heette voorheen Writer. Als u een bestaand experiment hebt dat gebruikmaakt van de Writer-module , wordt de naam van de module gewijzigd in Gegevens exporteren wanneer u het experiment vernieuwt.
Niet alle modules produceren uitvoer die compatibel is met exportgegevensbestemmingen . Gegevens exporteren kan bijvoorbeeld geen gegevensset opslaan die is geconverteerd naar de SVMLight-indeling. Gegevens exporteren ondersteunt deze indelingen:
- Gegevensset (interne ML Azure)
- .NET DataTable
- CSV met of zonder headers
- TSV met of zonder headers
Bekende problemen
Wanneer u Azure Table selecteert als de locatie voor het uitvoeren van uw gegevens, kan er af en toe een fout zijn opgetreden bij het schrijven naar de opgegeven tabel. Als dit gebeurt, worden de gegevens mogelijk naar een blob geschreven.
Als deze fout zich voordeed en u later niet meer kunt lezen uit de verwachte tabel, kunt u proberen een Azure Storage-hulpprogramma te gebruiken om de blobs in de opgegeven container in uw opslagaccount te controleren.
Op dit moment kunt u een blob niet opslaan in een opgegeven Hive-tabel. Als u tussenliggende resultaten wilt schrijven, vermijdt u het gebruik van een Hive-tabel in HDInsight en gebruikt u in plaats daarvan blobopslag of tabelopslag.
Als u momenteel HDFS selecteert als de locatie om uitvoergegevens op te slaan, wordt dit foutbericht geretourneerd: Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException.
Verwachte invoer
Naam | Type | Description |
---|---|---|
Gegevensset | Gegevenstabel | De gegevensset die moet worden geschreven. |
Moduleparameters
Deze tabel bevat parameters die van toepassing zijn op alle opties voor het exporteren van gegevens. Andere parameters zijn dynamisch en veranderen afhankelijk van de gegevensbestemming die u selecteert.
Name | Bereik | Type | Standaard | Beschrijving |
---|---|---|---|---|
Geef de gegevensbestemming op | Lijst | DataSourceOrSink | Blob service in Azure Storage | Geef aan of de gegevensbestemming een bestand in de Blob service is, een bestand in de Tabelservice, een SQL-database in Azure of een Hive-tabel. |
Resultaten in cache gebruiken | TRUE/FALSE | Booleaans | FALSE | Selecteer deze optie om te voorkomen dat resultaten onnodig worden herschreven. Als er upstream wijzigingen worden aangebracht in het experiment, worden met Gegevens exporteren altijd nieuwe resultaten uitgevoerd en geschreven. Als er echter niets is gewijzigd en u deze optie hebt geselecteerd, wordt Gegevens exporteren niet uitgevoerd om te voorkomen dat dezelfde resultaten worden herschreven. |
Uitzonderingen
Uitzondering | Description |
---|---|
Fout 0057 | Er treedt een uitzondering op wanneer u probeert een bestand of blob te maken die al bestaat. |
Fout 0001 | Er treedt een uitzondering op als een of meer opgegeven kolommen van de gegevensset niet kunnen worden gevonden. |
Fout 0027 | Er treedt een uitzondering op wanneer twee objecten dezelfde grootte moeten hebben, maar niet. |
Fout 0079 | Er treedt een uitzondering op als de containernaam in Azure Storage onjuist is opgegeven. |
Fout 0052 | Er treedt een uitzondering op als de toegangssleutel voor opslag voor het Azure-account onjuist is opgegeven. |
Fout 0064 | Er treedt een uitzondering op als de accountnaam of opslagtoegangssleutel voor het Azure-account onjuist is opgegeven. |
Fout 0071 | Er treedt een uitzondering op als de opgegeven referenties onjuist zijn. |
Fout 0018 | Er treedt een uitzondering op als de invoerset ongeldig is. |
Fout 0029 | Er treedt een uitzondering op wanneer een ongeldige URI wordt doorgegeven. |
Fout 0003 | Er treedt een uitzondering op als een of meer invoer null of leeg zijn. |
Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).
Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.
Zie ook
Gegevens importeren
Gegevensinvoer en -uitvoer
Gegevenstransformatie
Azure Table-Storage en Azure SQL Database
Lijst met A-Z-modules