Importieren einer Anzahltabelle

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Importiert eine zuvor erstellte Tabelle mit Zählungen.

Kategorie: Learning mit Anzahlen

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Import Count Table-Modul in Machine Learning Studio (klassisch) verwenden.

Das Modul Import Count Table dient dazu, Kunden, die eine Tabelle mit zahlenbasierten Statistiken mit einer früheren Version von Machine Learning erstellt haben, das Upgrade ihres Experiments zu ermöglichen. Dieses Modul führt die vorhandenen Zähltabellen mit neuen Daten zusammen.

Allgemeine Informationen zu Zähltabellen und deren Verwendung zum Erstellen von Features finden Sie unter Learning mit Count.

Wichtig

Dieses Modul wird ausschließlich aus Gründen der Abwärtskompatibilität mit Experimenten bereitgestellt, die die veraltete Buildanzahltabelle und die veralteten Count Featurizer-Module verwenden. Es wird empfohlen, das Experiment so zu aktualisieren, dass es die neueren Module verwendet, um die Vorteile neuer Features zu nutzen.

Für alle neuen Experimente wird empfohlen, die folgenden Module zu verwenden:

Konfigurieren der Importanzahltabelle

  1. Öffnen Sie in Machine Learning Studio (klassisch) ein Experiment, das eine mit dem veralteten Build Count Table-Modul erstellte Zähltabelle enthält.

  2. Fügen Sie dem Experiment das Modul Import Count Table hinzu.

  3. Verbinden die beiden Ausgaben des Moduls Build Count Table (veraltet) an die entsprechenden Eingabeports der Import Count Table an.

    Wenn Sie über ein weiteres Dataset mit Zählungen verfügen, das Sie mit der importierten Zähltabelle zusammenführen möchten, verbinden Sie es mit der Eingabe ganz rechts für das Import Count Table-Modul .

  4. Verwenden Sie die Option Counting type (Zähltyp ), um anzugeben, wo und wie die Zähltabelle gespeichert wird:

    • Dataset: Die zum Erstellen der Anzahl verwendeten Daten werden als Dataset in Machine Learning Studio (klassisch) gespeichert.

    • Blob: Die zum Erstellen der Anzahl verwendeten Daten werden als Blockblob in Windows Azure Storage gespeichert.

    • MapReduce: Die zum Erstellen der Anzahl verwendeten Daten werden als Blob in Windows Azure Storage gespeichert.

      Diese Option wird in der Regel für sehr große Datasets bevorzugt. Um auf die Anzahl zuzugreifen, müssen Sie den HDInsight-Cluster aktivieren. Ein MapReduce Auftrag wird gestartet, um die Zählung durchzuführen. Beide Aktivitäten können Speicher- und Computekosten verursachen.

      Weitere Informationen finden Sie unter HDInsight in Azure.

    Nachdem Sie den Datenspeichermodus angegeben haben, müssen Sie möglicherweise zusätzliche Verbindungsinformationen für die Daten angeben, auch wenn Sie zuvor ein Import Data-Modul im Experiment verwendet haben, um auf Daten zuzugreifen. Das liegt daran, dass das Count Featurizer-Modul (veraltet) separat auf den Datenspeicher zugreift, um die Daten zu lesen und die erforderlichen Tabellen zu erstellen.

  5. Verwenden Sie die Option Count table type (Tabellentyp zählen), um das Format und den Speichermodus der Tabelle anzugeben, die zum Speichern der Anzahl verwendet wird.

    • Wörterbuch: Verwendet eine Wörterbuchzählungstabelle.

      Alle Spaltenwerte in den ausgewählten Spalten werden als Zeichenfolgen behandelt und werden mit einem Bitarray auf 31 Bits gehasht. Daher werden alle Spaltenwerte als nicht negative ganze 32-Bit-Zahlen dargestellt.

    • CMSketch: Verwendet eine Tabelle, die in der Zählmindest-Sketchtabelle gespeichert ist.

      Bei diesem Format werden mehrere unabhängige Hashfunktionen mit einem kleineren Bereich verwendet, um die Speichereffizienz zu verbessern und die Wahrscheinlichkeit von Hashkonflikten zu reduzieren.

    Im Allgemeinen sollten Sie die Option Wörterbuch für kleinere Datasets (<1 GB) und die OPTION CMSketch für größere Datasets verwenden.

  6. Führen Sie das Experiment aus.

  7. Klicken Sie nach Abschluss des Vorgangs mit der rechten Maustaste auf die Ausgabe des Import Count Table-Moduls , wählen Sie Als Transformieren speichern aus, und geben Sie einen Namen für die Transformation ein. Wenn Sie dies tun, werden die zusammengeführten Zähltabellen und alle möglicherweise angewendeten Featurisierungsparameter in einem Format gespeichert, das auf ein neues Dataset angewendet werden kann.

Beispiele

Untersuchen Sie beispiele für die count-basierte Featurisierung mithilfe dieser Beispielexperimente im Azure KI-Katalog:

Hinweis

Diese Katalogexperimente wurden alle mit der früheren und jetzt veralteten Version der Learning mit Counts-Modulen erstellt. Wenn Sie das Experiment in Studio (klassisch) öffnen, wird das Experiment automatisch aktualisiert, um die neueren Module zu verwenden.

Erwartete Eingaben

Name Type Beschreibung
Count metadata Datentabelle Die Metadaten der Zählungen
Count table Datentabelle Die Count-Tabelle
Gezähltes Dataset Datentabelle Das für die Zählung verwendete Dataset

Modulparameter

Name Typ Range Optional Standard Beschreibung
Zähltyp CountingType Erforderlich Der Zähltyp

Ausgaben

Name Type Beschreibung
Zählen der Transformation ITransform-Schnittstelle Die Zähltransformation

Ausnahmen

Ausnahme Beschreibung
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0018 Eine Ausnahme tritt auf, wenn das Eingabedataset nicht gültig ist.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Lernen mit Zählungen