Udostępnij za pośrednictwem


Eksportowanie do tabeli platformy Azure

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

W tym artykule opisano sposób użycia opcji Eksportuj na platformę Azurew module Eksportowanie danych w programie Machine Learning Studio (wersja klasyczna).

Uwaga

Dotyczy: Machine Learning Studio (wersja klasyczna)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Ta opcja jest przydatna, gdy chcesz wyeksportować wyniki lub dane pośrednie z eksperymentu uczenia maszynowego do tabeli platformy Azure. Usługa tabel platformy Azure to usługa do zarządzania danymi na platformie Azure, która może przechowywać duże ilości ustrukturyzowanych danych nierelacyjnych. Jest to magazyn danych NoSQL, który akceptuje uwierzytelnione wywołania z wewnątrz i na zewnątrz platformy Azure.

Jak wyeksportować dane do tabeli platformy Azure

  1. Dodaj moduł Export Data (Eksportowanie danych) do eksperymentu. Ten moduł można znaleźć w kategorii Dane wejściowe i Wyjściowe w programie Studio (wersja klasyczna).

  2. Połączenie do modułu, który generuje dane, które chcesz wyeksportować do usługi Azure Table Storage.

  3. Określ, czy chcesz wyeksportować dane do publicznego udostępnionego zasobu, czy do prywatnego konta magazynu, które wymaga poświadczeń logowania, ustawiając opcję Typ uwierzytelniania.

    • Publiczny (adres URL sygnatury dostępu współdzielonego): wybierz tę opcję, jeśli konto obsługuje dostęp za pośrednictwem adresu URL sygnatury dostępu współdzielonego. W polu Table SAS URI (Adres URI sygnatury dostępu współdzielonego tabeli) wpisz lub wklej pełny adres URI definiujący konto i publiczny obiekt blob.

      Adres URL sygnatury dostępu współdzielonego to adres URL dostępu powiązanego z czasem, który można wygenerować za pomocą narzędzia magazynu platformy Azure. Na stronie dostępnej za pośrednictwem adresu URL sygnatury dostępu współdzielonego dane mogą być przechowywane tylko w tych formatach: CSV, TSV i ARFF.

    • Konto: wybierz tę opcję, jeśli dane są na koncie prywatnym. Należy również podać poświadczenia, w tym nazwę konta i klucz.

  4. Jeśli chcesz wyeksportować dane do zabezpieczonego, prywatnego magazynu, podaj poświadczenia wymagane do uzyskania dostępu do konta:

    • Nazwa konta tabeli: wpisz lub wklej nazwę konta zawierającego obiekt blob, do którego chcesz uzyskać dostęp. Jeśli na przykład pełny adres URL konta magazynu to https://myshared.table.core.windows.net, należy wpisać .myshared

    • Klucz konta tabeli: wklej klucz dostępu skojarzony z kontem magazynu.

    • Nazwa tabeli: wpisz nazwę określonej tabeli, którą chcesz odczytać.

  5. Określ kolumny do zapisania w magazynie tabel i kolumny do użycia podczas definiowania schematu tabeli przy użyciu właściwości kolumny.

    • Klucz partycji: wybierz kolumnę, która ma być używana do partycjonowania zapisanego zestawu danych dla tabeli w usłudze Azure Storage. Tabele na platformie Azure są partycjonowane w celu obsługi równoważenia obciążenia między węzłami magazynu. Wszystkie jednostki tabeli są zorganizowane według partycji; Dlatego właściwość PartitionKey jest wymagana dla wszystkich operacji na tabelach.

    • Klucz wiersza tabeli platformy Azure: wybierz kolumnę, która ma być używana dla właściwości RowKey . Właściwość RowKey to właściwość systemowa, która jest wymagana dla każdej jednostki w tabeli. Wraz z właściwością PartitionKey tworzy ona unikatowy indeks dla każdego wiersza w tabeli.

    Uwaga

    Należy użyć różnych kolumn dla RowKey i PartitionKey. Upewnij się, że dowolna kolumna, która zostanie wybranych dla wartości RowKey lub PartitionKey, jest również uwzględniona na liście kolumn docelowych lub zostanie podniesiony błąd.

    • Kolumny źródła tabeli platformy Azure: wybierz dodatkowe kolumny z zestawu danych, które chcesz zapisać w tabeli platformy Azure. Należy również uwzględnić kolumny wybrane dla partycji PartitionKey i RowKey.

    Aby uzyskać więcej informacji na temat tabel w usłudze Azure Storage, zobacz Understanding the Table Service Data Model (Omówienie modelu danych usługi Table Service).

  6. Określ nazwy kolumn do zapisu w tabeli.

    Ważne

    Należy podać nazwę kolumny dla każdej kolumny, która jest wyprowadzana do tabeli, w tym dla kolumn RowKey, PartitionKey i origin.

    Jeśli liczba nazw kolumn nie odpowiada liczbie kolumn wyjściowych, zostanie podniesiony błąd.

    W przypadku wpisywania nowych nazw kolumn muszą one być podane w kolejności indeksów kolumn kolumn źródłowych.

  7. Tryb zapisu tabeli platformy Azure: wskaż, jak chcesz, aby eksportowanie danych działało, gdy dane już istnieją w tabeli platformy Azure.

    • Wstaw: Operacja Insert Entity wstawia nową jednostkę z unikatowym kluczem podstawowym, który jest formowany z kombinacji właściwości PartitionKey i RowKey .

    • Scalanie: operacja Merge Entity aktualizuje istniejącą jednostkę, aktualizując jej właściwości. Ta operacja nie zastępuje istniejącej jednostki.

    • Zastąp: operacja Update Entity zastępuje zawartość danej jednostki w tabeli.

    • InsertOrReplace: operacja InsertOrReplace Entity wstawia jednostkę, jeśli jednostka nie istnieje. Jeśli jednostka istnieje, zastępuje ona istniejącą.

    • InsertOrMerge: operacja InsertOrMerge Entity wstawia jednostkę, jeśli jednostka nie istnieje. Jeśli jednostka istnieje, scala podane właściwości jednostki z już istniejącymi.

  8. Użyj buforowanych wyników: wskaż, czy dane mają być odświeżane przy każdym uruchomieniu eksperymentu.

    Jeśli wybierzesz tę opcję, moduł Eksportuj dane zapisze dane w określonej tabeli przy pierwszym uruchomieniu eksperymentu, a następnie nie będzie wykonywać operacji zapisu, chyba że wystąpią zmiany nadrzędne.

    Usunięcie zaznaczenia tej opcji powoduje, że dane są zapisywane w miejscu docelowym przy każdym uruchomieniu eksperymentu, niezależnie od tego, czy dane są takie same, czy nie.

  9. Uruchom eksperyment.

Uwagi techniczne

Ta sekcja zawiera szczegóły implementacji, porady i odpowiedzi na często zadawane pytania.

Często zadawane pytania

Dlaczego wystąpił błąd podczas zapisywania w istniejącej tabeli

Sprawdź schemat tabeli, aby upewnić się, że nazwy kolumn i typy danych są takie same. Na przykład w usłudze Azure Table Storage kolumna ID powinna być ciągiem.

Jeśli wystąpi błąd Błąd 0027: Rozmiar przekazanych obiektów jest niespójny, sprawdź, czy tabela istnieje w określonym kontenerze. Obecnie usługa Azure ML może zapisywać tylko w istniejących tabelach.

Dlaczego otrzymuję komunikat o błędzie, że nie można odnaleźć istniejącej kolumny

Jeśli eksperyment nie został uruchomiony, kolumny nadrzędne nie są czasami wykrywane przez eksportowanie danych. Jeśli w eksperymencie zostaną wprowadzone jakiekolwiek nadrzędne zmiany, może być konieczne usunięcie modułu Eksportuj dane, a następnie dodanie go i ponowne skonfigurowanie.

Jak uniknąć niepotrzebnie ponownego zapisywania tych samych danych

Jeśli dane w eksperymencie zmienią się z jakiegokolwiek powodu, moduł Eksportowanie danych zawsze zapisze nowe dane.

Jeśli jednak uruchamiasz eksperyment z innymi zmianami, które nie mają wpływu na wyniki, ustaw opcję Użyj buforowanych wyników na wartość TRUE. Moduł sprawdzi, czy eksperyment został wcześniej uruchomiony przy użyciu tych samych opcji, a jeśli zostanie znaleziony poprzedni wynik, dane nie zostaną zapisane w tabeli platformy Azure.

Czy mogę wyeksportować dane do innego regionu geograficznego

Tak. Jeśli jednak konto magazynu znajduje się w innym regionie niż węzeł obliczeniowy używany do eksperymentu uczenia maszynowego, dostęp do danych może być wolniejszy. Ponadto są naliczane opłaty za ruch przychodzący i wychodzący danych w subskrypcji.

Przykłady

Przykłady użycia tych modułów uczenia maszynowego można znaleźć w Azure AI Gallery.

Parametry modułu

Publiczna lub SAS — opcje publiczne

Nazwa Zakres Typ Domyślny Opis
Table SAS URI dowolny Ciąg

Konto — opcje konta prywatnego

Nazwa Zakres Typ Domyślny Opis
Nazwa konta tabeli
Klucz konta tabeli dowolny Securestring

Opcje magazynu

Nazwa Zakres Typ Domyślny Opis
Nazwa tabeli Ciąg brak
Klucz partycji dowolny Securestring brak Wybierz kolumnę, która ma być kluczem podczas partycjonowania tabeli. Jeśli żadna kolumna nie jest zaznaczona, nazwa kolumny jako klucz partycji dla wszystkich wpisów
Klucz wiersza tabeli platformy Azure dowolny ColumnPicker brak Wybierz kolumnę zawierającą unikatowy identyfikator wierszy tabeli. Wartość domyślna klucza wiersza opartego na identyfikatorze GUID
Kolumny źródła tabeli platformy Azure dowolny ColumnPicker brak Określanie kolumn do dołączyć do tabeli według nazwy lub indeksu kolumn
Kolumny docelowe tabel platformy Azure dowolny Ciąg brak Wpisz nazwy kolumn do użycia w tabeli docelowej
Tryb zapisu tabeli platformy Azure Lista: Insert, Merge, Replace, InsertOrReplace, InsertOrMerge Wyliczenie brak
Używanie buforowanych wyników PRAWDA/FAŁSZ Wartość logiczna FALSE Moduł jest wykonywany tylko wtedy, gdy nie istnieje prawidłowa pamięć podręczna; w przeciwnym razie użyj danych buforowanych z poprzedniego wykonania.

Wyjątki

Wyjątek Opis
Błąd 0027 Wyjątek występuje, gdy dwa obiekty muszą mieć ten sam rozmiar, ale nie są.
Błąd 0003 Wyjątek występuje, gdy co najmniej jeden element wejściowy ma wartość null lub jest pusty.
Błąd 0029 Wyjątek występuje, gdy zostanie przekazany nieprawidłowy identyfikator URI.
Błąd 0030 występuje wyjątek w programie , gdy nie jest możliwe pobranie pliku.
Błąd 0002 Wyjątek występuje, jeśli co najmniej jeden parametr nie może zostać analizowany lub przekonwertowany z określonego typu na typ wymagany przez metodę docelową.
Błąd 0009 Wyjątek występuje, jeśli nazwa konta usługi Azure Storage lub nazwa kontenera jest niepoprawnie określona.
Błąd 0048 Wyjątek występuje, gdy nie jest możliwe otwarcie pliku.
Błąd 0046 Wyjątek występuje, gdy nie jest możliwe utworzenie katalogu w określonej ścieżce.
Błąd 0049 Wyjątek występuje, gdy nie jest możliwe analizowanie pliku.

Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kodów błędów.

Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).

Zobacz też

Importowanie danych
Eksportowanie danych
Eksportuj do Azure SQL Database
Eksportowanie do Azure Blob Storage
Eksportowanie do zapytania Hive