Delen via


Exporteren naar Azure Table

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel wordt beschreven hoe u de optie Exporteren naar Azure gebruikt in de module Gegevens exporteren in Machine Learning Studio (klassiek).

Notitie

Van toepassing op: Machine Learning Studio (klassiek)

Vergelijkbare modules met slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Deze optie is handig als u resultaten of tussenliggende gegevens uit een machine learning wilt exporteren naar een Azure-tabel. De Azure-tabelservice is een gegevensbeheerservice in Azure die grote hoeveelheden gestructureerde, niet-relationele gegevens kan opslaan. Het is een NoSQL-gegevensopslag die geverifieerde aanroepen van binnen en buiten Azure accepteert.

Gegevens exporteren naar een Azure-tabel

  1. Voeg de module Gegevens exporteren toe aan uw experiment. U vindt deze module in de categorie Gegevensinvoer en - uitvoer in Studio (klassiek).

  2. Verbinding maken aan de module die de gegevens produceert die u wilt exporteren naar Azure Table Storage.

  3. Geef op of u gegevens wilt exporteren naar een openbare gedeelde resource of naar een privéopslagaccount dat aanmeldingsreferenties vereist door de optie Verificatietype in te stellen.

    • Openbaar (SAS-URL): kies deze optie als het account toegang via SAS-URL ondersteunt. Typ of plak in het veld Sas-URI voor tabel de volledige URI die het account en de openbare blob definieert.

      De SAS-URL is een url voor tijdsgebonden toegang die u kunt genereren met behulp van een Azure Storage-hulpprogramma. Op een pagina die toegankelijk is via EEN SAS-URL, kunnen gegevens alleen worden opgeslagen in de volgende indelingen: CSV, TSV en ARFF.

    • Account: kies deze optie als uw gegevens zich in een privéaccount hebben. U moet ook referenties met inbegrip van de accountnaam en de sleutel.

  4. Als u uw gegevens wilt exporteren naar beveiligde privéopslag, geeft u de referenties op die nodig zijn voor toegang tot het account:

    • Tabelaccountnaam: typ of plak de naam van het account dat de blob bevat die u wilt openen. Als de volledige URL van het opslagaccount bijvoorbeeld is https://myshared.table.core.windows.net, typt u myshared.

    • Tabelaccountsleutel: Plak de toegangssleutel die is gekoppeld aan het opslagaccount.

    • Tabelnaam: typ de naam van de specifieke tabel die u wilt lezen.

  5. Geef op welke kolommen moeten worden opgeslagen in het tabelopslag en welke kolommen moeten worden gebruikt bij het definiëren van het tabelschema met behulp van de kolomeigenschappen.

    • Partitiesleutel: kies de kolom die moet worden gebruikt voor het partitioneren van de opgeslagen gegevensset voor de tabel in Azure Storage. Tabellen in Azure worden gepartitief ter ondersteuning van taakverdeling over opslagknooppunten. Alle tabelentiteiten zijn geordend op partitie; Daarom is de eigenschap PartitionKey vereist voor alle tabelbewerkingen.

    • Azure-tabelrijsleutel: kies de kolom die moet worden gebruikt voor de eigenschap RowKey . De eigenschap RowKey is een systeem-eigenschap die vereist is voor elke entiteit in een tabel. Samen met de eigenschap PartitionKey vormt deze een unieke index voor elke rij in de tabel.

    Notitie

    U moet verschillende kolommen gebruiken voor RowKey en PartitionKey. Zorg ervoor dat een kolom die u selecteert voor de RowKey of PartitionKey ook is opgenomen in de lijst met doelkolommen, of dat er een fout is opgetreden.

    • Kolommen van oorsprong uit Azure-tabel: selecteer eventuele extra kolommen uit de gegevensset die u wilt opslaan in de Azure-tabel. U moet ook de kolommen opnemen die zijn geselecteerd voor PartitionKeyen RowKey.

    Zie Understanding the Table Service Data Model (Het gegevensmodel van de tabelservice) voor meer informatie over tabellen in Azure Storage.

  6. Geef de namen op van de kolommen die naar de tabel moeten worden geschreven.

    Belangrijk

    U moet een kolomnaam verstrekken voor elke kolom die u naar de tabel uitvoert, met inbegrip van de kolommen RowKey, PartitionKey en alle kolommen van oorsprong.

    Als het aantal kolomnamen dat u op geeft niet overeen komt met het aantal uitvoerkolommen, tuurt er een fout.

    Als u nieuwe kolomnamen typt, moeten deze worden opgegeven in de volgorde van de kolomindexen van de bronkolommen.

  7. Schrijfmodus voor Azure-tabel: geef aan hoe u wilt dat de exportgegevens zich gedragen wanneer gegevens al bestaan in de Azure-tabel.

    • Invoegen: Met de Insert Entity bewerking wordt een nieuwe entiteit met een unieke primaire sleutel geplaatst, die wordt gevormd door een combinatie van de eigenschappen PartitionKey en RowKey .

    • Samenvoegen: met de Merge Entity bewerking wordt een bestaande entiteit bijgewerkt door de eigenschappen van de entiteit bij te werken. Deze bewerking vervangt de bestaande entiteit niet.

    • Vervangen: De Update Entity bewerking vervangt de inhoud van de opgegeven entiteit in een tabel.

    • InsertOrReplace: Met de InsertOrReplace Entity bewerking wordt de entiteit invoegen als de entiteit niet bestaat. Als de entiteit bestaat, wordt de bestaande vervangen.

    • InsertOrMerge: Met de InsertOrMerge Entity bewerking wordt de entiteit invoegen als de entiteit niet bestaat. Als de entiteit bestaat, worden de opgegeven entiteitseigenschappen samengevoegd met de al bestaande entiteitseigenschappen.

  8. Resultaten in cache gebruiken: geef aan of u wilt dat de gegevens telkens worden vernieuwd wanneer het experiment wordt uitgevoerd.

    Als u deze optie selecteert, slaat de module Gegevens exporteren gegevens op in de opgegeven tabel wanneer het experiment voor de eerste keer wordt uitgevoerd en daarna worden er geen schrijf- of schrijfwijzigingen uitgevoerd, tenzij er upstream-wijzigingen zijn.

    Als u deze optie deselecteert, worden de gegevens steeds naar het doel geschreven wanneer het experiment wordt uitgevoerd, ongeacht of de gegevens hetzelfde zijn of niet.

  9. Voer het experiment uit.

Technische opmerkingen

Deze sectie bevat implementatiedetails, tips en antwoorden op veelgestelde vragen.

Veelgestelde vragen

Waarom krijg ik een foutmelding bij het schrijven naar een bestaande tabel

Controleer het schema van de tabel om te controleren of de kolommennamen en gegevenstypen hetzelfde zijn. In Azure Table Storage wordt bijvoorbeeld verwacht dat de kolom ID een tekenreeks is.

Als de fout Fout 0027: De grootte van doorgegeven objecten inconsistent is, controleert u of de tabel in de opgegeven container bestaat. Momenteel kunnen ML alleen naar bestaande tabellen schrijven.

Waarom krijg ik de foutmelding dat een bestaande kolom niet kan worden gevonden?

Als u het experiment niet hebt uitgevoerd, worden upstream-kolommen soms niet gedetecteerd door De gegevens exporteren. Als u upstream wijzigingen aan het experiment aanwijst, moet u mogelijk de module Gegevens exporteren verwijderen en deze vervolgens toevoegen en opnieuw configureren.

Hoe voorkom ik dat dezelfde gegevens onnodig opnieuw worden geschreven?

Als de gegevens in uw experiment om een of andere reden worden gewijzigd, schrijft de module Gegevens exporteren altijd de nieuwe gegevens.

Als u het experiment echter met andere veranderingen die geen invloed hebben op de resultaten, in de cache op TRUE in te stellen. De module controleert of het experiment eerder met dezelfde opties is uitgevoerd. Als er een eerder resultaat wordt gevonden, worden de gegevens niet naar de Azure-tabel geschreven.

Kan ik gegevens exporteren naar een andere geografische regio?

Ja. Als het opslagaccount zich echter in een andere regio dan het rekenpunt dat wordt gebruikt voor het machine learning experiment, kan de toegang tot gegevens langzamer zijn. Daarnaast worden er kosten in rekening gebracht voor in- en uittreding van gegevens in het abonnement.

Voorbeelden

Zie de machine learning voor voorbeelden van het gebruik van deze Azure AI Gallery.

Moduleparameters

Openbaar of SAS: openbare opties

Name Bereik Type Standaard Beschrijving
SAS-URI voor tabel alle Tekenreeks

Account - opties voor privé-account

Name Bereik Type Standaard Beschrijving
Tabelaccountnaam
Tabelaccountsleutel alle SecureString

Opslagopties

Name Bereik Type Standaard Beschrijving
Tabelnaam Tekenreeks geen
Partitiesleutel alle SecureString geen Kies de kolom die als sleutel moet worden gebruikt bij het partitioneren van de tabel. Als er geen kolom is geselecteerd, wordt de kolomnaam als partitiesleutel voor alle vermeldingen
Rijsleutel voor Azure-tabel alle ColumnPicker geen Kies de kolom die de unieke id voor tabelrijen bevat. Wordt standaard ingesteld op een rijsleutel op basis van GUID
Kolommen van azure table origin alle ColumnPicker geen Opgeven welke kolommen moeten worden opgenomen in de tabel, op naam of per kolomindex
Azure-tabelbestemmingkolommen alle Tekenreeks geen Typ de namen van de kolommen die moeten worden gebruikt in de doeltabel
Schrijfmodus voor Azure-tabel Lijst: Invoegen, Samenvoegen, Vervangen, InsertOrReplace, InsertOrMerge Enum geen
Resultaten in cache gebruiken TRUE/FALSE Booleaans FALSE Module wordt alleen uitgevoerd als er geen geldige cache bestaat; gebruik anders gegevens uit eerdere uitvoering in de cache.

Uitzonderingen

Uitzondering Description
Fout 0027 Er treedt een uitzondering op wanneer twee objecten dezelfde grootte moeten hebben, maar dat niet zijn.
Fout 0003 Een uitzondering treedt op als een of meer invoer null of leeg zijn.
Fout 0029 Er treedt een uitzondering op wanneer een ongeldige URI wordt doorgegeven.
Fout 0030 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te downloaden.
Fout 0002 Er treedt een uitzondering op als een of meer parameters niet kunnen worden geparseerd of geconverteerd van het opgegeven type naar het type dat is vereist door de doelmethode.
Fout 0009 Er treedt een uitzondering op als de naam van het Azure-opslagaccount of de containernaam onjuist is opgegeven.
Fout 0048 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te openen.
Fout 0046 Er treedt een uitzondering op wanneer het niet mogelijk is om een map te maken op het opgegeven pad.
Fout 0049 Er treedt een uitzondering op wanneer het niet mogelijk is om een bestand te parseren.

Zie Foutcodes voor een lijst met fouten die specifiek zijn Machine Learning voor Studio-modules (klassiek).

Zie Foutcodes voor een lijst Machine Learning REST API API-uitzonderingen.

Zie ook

Gegevens importeren
Gegevens exporteren
Exporteren naar Azure SQL Database
Exporteren naar Azure Blob Storage
Exporteren naar Hive-query