Udostępnij za pośrednictwem


Import Count Table

Ważne

Obsługa programu Machine Learning Studio (wersja klasyczna) zakończy się 31 sierpnia 2024 r. Zalecamy przejście do usługi Azure Machine Learning przed tym terminem.

Od 1 grudnia 2021 r. nie będzie można tworzyć nowych zasobów programu Machine Learning Studio (wersja klasyczna). Do 31 sierpnia 2024 r. można będzie nadal korzystać z istniejących zasobów programu Machine Learning Studio (wersja klasyczna).

Dokumentacja programu ML Studio (wersja klasyczna) jest wycofywana i może nie być aktualizowana w przyszłości.

Importuje wcześniej utworzoną tabelę z liczbami

Kategoria: Edukacja z liczbami

Uwaga

Dotyczy: tylko Machine Learning Studio (klasyczne)

Podobne moduły przeciągania i upuszczania są dostępne w Azure Machine Learning projektanta.

Omówienie modułu

W tym artykule opisano sposób korzystania z modułu Import Count Table w programie Machine Learning Studio (wersja klasyczna).

Celem modułu Import Count Table jest umożliwienie klientom, którzy tworzyli tabelę statystyk opartych na liczbach przy użyciu starszej wersji Machine Learning uaktualnianie eksperymentu. Ten moduł scala istniejące tabele zliczania z nowymi danymi.

Aby uzyskać ogólne informacje na temat tabel zliczania i sposobu ich tworzenia, zobacz Edukacja z liczbami.

Ważne

Ten moduł jest dostarczany wyłącznie w celu zapewnienia zgodności z poprzednimi wersjami eksperymentów, które korzystają z przestarzałej tabeli liczby kompilacji i przestarzałych modułów Count Featurizer. Zalecamy uaktualnienie eksperymentu w celu korzystania z nowszej wersji modułów w celu skorzystania z nowych funkcji.

W przypadku wszystkich nowych eksperymentów zalecamy użycie następujących modułów:

How to configure Import Count Table

  1. W Machine Learning Studio (wersja klasyczna) otwórz eksperyment zawierający tabelę count utworzoną przy użyciu przestarzałego modułu Build Count Table .

  2. Dodaj moduł Import Count Table (Importuj tabelę zliczania) do eksperymentu.

  3. Połączenie dane wyjściowe modułu Build Count Table (przestarzałe) do pasujących portów wejściowych tabeli zliczania importu.

    Jeśli masz inny zestaw danych z liczbami, który chcesz scalić z zaimportowaną tabelą count, połącz go z najbardziej po prawej stronie danych wejściowych modułu Import Count Table (Importuj tabelę zliczania ).

  4. Użyj opcji Typ zliczania , aby określić, gdzie i jak jest przechowywana tabela zliczania:

    • Zestaw danych: dane używane do kompilowania są zapisywane jako zestaw danych w programie Machine Learning Studio (wersja klasyczna).

    • Obiekt blob: dane używane do kompilowania są przechowywane jako blokowy obiekt blob w Windows Azure Storage.

    • MapReduce: dane używane do kompilowania liczników są przechowywane jako obiekt blob w Windows Azure Storage.

      Ta opcja jest zwykle preferowana w przypadku bardzo dużych zestawów danych. Aby uzyskać dostęp do liczników, należy aktywować klaster usługi HDInsight. Zostanie MapReduce zadanie w celu wykonania zliczania. Oba te działania mogą wiązać się z kosztami magazynu i zasobów obliczeniowych.

      Aby uzyskać więcej informacji, zobacz HDInsight on Azure (Usługa HDInsight na platformie Azure).

    Po określeniu trybu przechowywania danych może być konieczne podanie dodatkowych informacji o połączeniu dla danych, nawet jeśli wcześniej w eksperymencie był używany moduł Importuj dane w celu uzyskania dostępu do danych. Wynika to z tego, że moduł Count Featurizer (przestarzały) uzyskuje oddzielnie dostęp do magazynu danych w celu odczytania danych i skompilowania wymaganych tabel.

  5. Użyj opcji Typ tabeli Liczba , aby określić format i tryb przechowywania tabeli używanej do przechowywania liczb.

    • Słownik: używa tabeli zliczanych słowników.

      Wszystkie wartości kolumn w wybranych kolumnach są traktowane jako ciągi i są skrótami przy użyciu tablicy bitowej o rozmiarze do 31 bitów. W związku z tym wszystkie wartości kolumn są reprezentowane przez nieujemną 32-bitową liczbę całkowitą.

    • CMSketch: używa tabeli zapisanej w tabeli minimalnej liczby szkiców.

      W tym formacie wiele niezależnych funkcji skrótu o mniejszym zakresie jest używanych w celu zwiększenia wydajności pamięci i zmniejszenia ryzyka kolizji skrótów.

    Ogólnie rzecz biorąc, należy użyć opcji Słownik dla mniejszych zestawów danych (<1 GB) i użyć opcji CMSketch w przypadku większych zestawów danych.

  6. Uruchom eksperyment.

  7. Po zakończeniu kliknij prawym przyciskiem myszy dane wyjściowe modułu Import Count Table (Importuj tabelę zliczania), wybierz pozycję Save as Transform (Zapisz jako przekształcenie) i wpisz nazwę przekształcenia. Gdy to zrobisz, scalone tabele zliczania i wszelkie zastosowane parametry cechowania zostaną zapisane w formacie, który można zastosować do nowego zestawu danych.

Przykłady

Zapoznaj się z przykładami cechowania na podstawie liczby, korzystając z tych przykładowych eksperymentów w Azure AI Gallery:

Uwaga

Wszystkie te eksperymenty z galerii zostały utworzone przy użyciu starszej, a teraz przestarzałej wersji aplikacji Edukacja z modułami Counts. Po otwarciu eksperymentu w programie Studio (wersja klasyczna) eksperyment zostanie automatycznie uaktualniony w celu użycia nowszej wersji modułów.

Oczekiwane dane wejściowe

Nazwa Typ Opis
Zlicz metadane Tabela danych Metadane liczników
Tabela zliczanych Tabela danych Tabela zliczania
Zliczony zestaw danych Tabela danych Zestaw danych używany do zliczania

Parametry modułu

Nazwa Typ Zakres Opcjonalne Domyślny Opis
Typ zliczania Typ zliczania Wymagane Typ zliczania

Dane wyjściowe

Nazwa Typ Opis
Przekształcanie zliczania ITransform, interfejs Przekształcenie zliczania

Wyjątki

Wyjątek Opis
Błąd 0003 Wyjątek występuje, jeśli co najmniej jeden z danych wejściowych ma wartość null lub jest pusty.
Błąd 0018 Wyjątek występuje, jeśli wejściowy zestaw danych jest nieprawidłowy.

Aby uzyskać listę błędów specyficznych dla modułów programu Studio (wersja klasyczna), zobacz Machine Learning Kody błędów.

Aby uzyskać listę wyjątków interfejsu API, zobacz Machine Learning API REST Error Codes (Kody błędów interfejsu API REST).

Zobacz też

Edukacja z liczbami