Behandeln von Problemen bei Experimenten mit automatisiertem ML in Python

Artikel
06/03/2023

In diesem Leitfaden wird beschrieben, wie Sie bekannte Probleme bei Ihren Experimenten mit automatisiertem maschinellen Lernen mit dem Azure Machine Learning SDK identifizieren und beheben.

Versionsabhängigkeiten

AutoML-Abhängigkeiten von neueren Paketversionen führen dazu, dass die Kompatibilität nicht mehr gegeben ist. In den SDK-Versionen nach 1.13.0 werden Modelle in älteren SDKs nicht mehr geladen, weil eine Inkompatibilität zwischen den älteren Versionen in den vorherigen AutoML-Paketen und den neueren heutigen Versionen besteht.

Es können Fehler der folgenden Art auftreten:

Fehler „Modul nicht gefunden“, z. B.:

No module named 'sklearn.decomposition._truncated_svd'
Importfehler, z. B.:

ImportError: cannot import name 'RollingOriginValidator',
Attributfehler, z. B.:

AttributeError: 'SimpleImputer' object has no attribute 'add_indicator'

Die Lösungen richten sich nach Ihrer AutoML-SDK-Trainingsversion:

Wenn Ihre AutoML SDK-Trainingsversion höher als 1.13.0 ist, benötigen Sie pandas == 0.25.1 und scikit-learn==0.22.1.
- Wenn die Version nicht übereinstimmt, führen Sie ein Upgrade von scikit-learn oder Pandas auf die richtige Version durch, indem Sie Folgendes verwenden:
```
    pip install --upgrade pandas==0.25.1
    pip install --upgrade scikit-learn==0.22.1
```
Wenn Ihre AutoML SDK-Trainingsversion kleiner als oder gleich 1.12.0 ist, benötigen Sie pandas == 0.23.4 und sckit-learn==0.20.3.
- Wenn die Version nicht übereinstimmt, führen Sie ein Downgrade von scikit-learn oder Pandas auf die richtige Version durch, indem Sie Folgendes verwenden:
```
  pip install --upgrade pandas==0.23.4
  pip install --upgrade scikit-learn==0.20.3
```

Einrichten

Für AutoML-Paketänderungen seit Version 1.0.76 muss die vorherige Version deinstalliert werden, bevor das Update auf die neue Version durchgeführt wird.

ImportError: cannot import name AutoMLConfig

Falls dieser Fehler nach dem Upgrade von einer älteren SDK-Version als v1.0.76 auf v1.0.76 oder höher auftritt, können Sie ihn beheben, indem Sie Folgendes ausführen: pip uninstall azureml-train automl und dann pip install azureml-train-automl. Das Skript „automl_setup.cmd“ erledigt dies automatisch.
Fehler bei „automl_setup“
- Unter Windows führen Sie „automl_setup“ von einer Anaconda-Eingabeaufforderung aus. Installieren Sie Miniconda.
- Stellen Sie sicher, dass die 64-Bit-Version 4.4.10 oder höher von Conda installiert ist. Sie können dies mit dem Befehl conda info überprüfen. platform sollte für Windows win-64 und für Mac osx-64 lauten. Verwenden Sie den Befehl conda -V, um die Version zu überprüfen. Wenn eine frühere Version installiert ist, können Sie diese mit dem folgenden Befehl aktualisieren: conda update conda. Sie können auch eine Überprüfung auf eine 32-Bit-Version durchführen.
- Stellen Sie sicher, dass Conda installiert ist.
- Linux: gcc: error trying to exec 'cc1plus'
  1. Wenn der Fehler gcc: error trying to exec 'cc1plus': execvp: No such file or directory auftritt, sollten Sie die GCC-Buildtools für Ihre Linux-Distribution installieren. Verwenden Sie unter Ubuntu beispielsweise den folgenden Befehl: sudo apt-get install build-essential.
  2. Übergeben Sie einen neuen Namen als ersten Parameter an „automl_setup“, um eine neue Conda-Umgebung zu erstellen. Vorhandene Conda-Umgebungen können Sie mit conda env list anzeigen und mit conda env remove -n <environmentname> entfernen.
Fehler bei „automl_setup_linux.sh“ : Gehen Sie folgendermaßen vor, wenn bei „automl_setup_linus.sh“ unter Ubuntu Linux folgender Fehler auftritt: unable to execute 'gcc': No such file or directory
1. Stellen Sie sicher, dass die ausgehenden Ports 53 und 80 aktiviert sind. Auf einem virtuellen Azure-Computer können Sie zu diesem Zweck zum Azure-Portal wechseln, die VM auswählen und auf Netzwerk klicken.
2. Führen Sie den folgenden Befehl aus: sudo apt-get update
3. Führen Sie den folgenden Befehl aus: sudo apt-get install build-essential --fix-missing
4. Führen Sie automl_setup_linux.sh erneut aus.
Fehler bei „configuration.ipynb“ :
- Stellen Sie bei einer lokalen Conda-Instanz zunächst sicher, dass automl_setup erfolgreich ausgeführt wurde.
- Stellen Sie sicher, dass die „subscription_id“ richtig ist. Suchen Sie die „subscription_id“ im Azure-Portal, indem Sie „Alle Dienste“ und dann „Abonnements“ auswählen. Die Zeichen „<“ und „>“ dürfen im subscription_id-Wert nicht enthalten sein. Dies ist ein Beispiel für ein gültiges Format: subscription_id = "12345678-90ab-1234-5678-1234567890abcd".
- Stellen Sie sicher, dass Sie Zugriff als „Besitzer“ oder „Mitwirkender“ auf das Abonnement haben.
- Überprüfen Sie, ob die verwendete Region unterstützt wird: eastus2, eastus, westcentralus, southeastasia, westeurope, australiaeast, westus2, southcentralus.
- Stellen Sie über das Azure-Portal sicher, dass Zugriff auf die Region besteht.
Fehler bei „workspace.from_config“ :

Gehen Sie wie folgt vor, falls beim Aufruf ws = Workspace.from_config() ein Fehler auftritt:
1. Stellen Sie sicher, dass das Notebook „configuration.ipynb“ erfolgreich ausgeführt wurde.
2. Wenn das Notebook in einem Ordner ausgeführt werden soll, der sich nicht in dem Ordner befindet, in dem configuration.ipynb ausgeführt wurde, kopieren Sie den Ordner „aml_config“ und die darin enthaltene Datei „config.json“ in den neuen Ordner. „Workspace.from_config“ liest die Datei „config.json“ für den Notebookordner oder den übergeordneten Ordner.
3. Wenn ein neues Abonnement, eine neue Ressourcengruppe, ein neuer Arbeitsbereich oder eine neue Region verwendet wird, müssen Sie das Notebook configuration.ipynb erneut ausführen. Eine direkte Änderung von „config.json“ funktioniert nur, wenn der Arbeitsbereich bereits in der angegebenen Ressourcengruppe im angegebenen Abonnement vorhanden ist.
4. Wenn Sie die Region ändern möchten, ändern Sie den Arbeitsbereich, die Ressourcengruppe oder das Abonnement. Workspace.create erstellt keinen Arbeitsbereich und aktualisiert auch keinen vorhandenen Arbeitsbereich, auch dann nicht, wenn eine andere Region angegeben wird.

TensorFlow

Ab der SDK-Version 1.5.0 installiert das automatisierte maschinelle Lernen TensorFlow-Modelle nicht mehr standardmäßig. Installieren Sie tensorflow==1.12.0 über CondaDependencies, wenn Sie TensorFlow installieren und für Ihre Experimente mit automatisiertem ML nutzen möchten.

  from azureml.core.runconfig import RunConfiguration
  from azureml.core.conda_dependencies import CondaDependencies
  run_config = RunConfiguration()
  run_config.environment.python.conda_dependencies = CondaDependencies.create(conda_packages=['tensorflow==1.12.0'])

NumPy-Fehler

import numpy führt unter Windows zu einem Fehler: In einigen Windows-Umgebungen tritt beim Laden von NumPy mit der neuesten Python-Version 3.6.8 ein Fehler auf. Versuchen Sie in diesem Fall die Python-Version 3.6.7.
import numpy führt zu einem Fehler: Überprüfen Sie die TensorFlow-Version in der Conda-Umgebung für automatisiertes ML. Es werden Versionen unter 1.13 unterstützt. Deinstallieren Sie TensorFlow aus der Umgebung, wenn die Version größer oder gleich 1.13 ist.

Sie können die Version von TensorFlow wie folgt überprüfen und deinstallieren:

Starten Sie eine Befehlsshell, und aktivieren Sie die Conda-Umgebung, in der die Pakete für das automatisierte maschinelle Lernen installiert sind.
Geben Sie pip freeze ein, und suchen Sie nach tensorflow. Die aufgelistete Version sollte kleiner als 1.13 sein.
Wenn die aufgelistete Version keine unterstützte Version ist, geben Sie in der Befehlsshell pip uninstall tensorflow ein, und bestätigen Sie den Befehl mit „y“.

`jwt.exceptions.DecodeError`

Die genaue Fehlermeldung lautet: jwt.exceptions.DecodeError: It is required that you pass in a value for the "algorithms" argument when calling decode().

Bei SDK-Versionen bis einschließlich 1.17.0 führt die Installation möglicherweise zu einer nicht unterstützten Version von PyJWT. Vergewissern Sie sich, dass die PyJWT-Version in der Conda-Umgebung für automatisiertes ML eine unterstützte Version ist. Dies sind PyJWT-Version unter 2.0.0.

Sie können die PyJWT-Version wie folgt überprüfen:

Starten Sie eine Befehlsshell, und aktivieren Sie die Conda-Umgebung, in der die Pakete für automatisiertes ML installiert sind.
Geben Sie pip freeze ein, und suchen Sie nach PyJWT. Die aufgelistete Version sollte kleiner als 2.0.0 sein.

Wenn die aufgeführte Version nicht unterstützt wird:

Erwägen Sie, ein Upgrade auf die neueste Version des AutoML SDK durchzuführen: pip install -U azureml-sdk[automl].
Wenn dies nicht praktikabel ist, deinstallieren Sie PyJWT aus der Umgebung, und installieren Sie die richtige Version wie folgt:
1. Geben Sie in der Befehlsshell pip uninstall PyJWT ein, und bestätigen Sie den Vorgang mit y.
2. Führen Sie die Installation mithilfe von pip install 'PyJWT<2.0.0' aus.

Datenzugriff

Für Aufträge von automatisiertem ML müssen Sie sicherstellen, dass der Dateidatenspeicher, der eine Verbindung mit Ihrem AzureFile-Speicher herstellt, über die entsprechenden Anmeldeinformationen für die Authentifizierung verfügt. Andernfalls wird die folgende Meldung angezeigt. Erfahren Sie, wie Sie Ihre Anmeldeinformationen für die Datenzugriffsauthentifizierung aktualisieren.

Fehlermeldung: Could not create a connection to the AzureFileService due to missing credentials. Either an Account Key or SAS token needs to be linked the default workspace blob store.

Datenschema

Wenn Sie versuchen, über die Schaltfläche Bearbeiten und übermitteln in Azure Machine Learning Studio ein neues Experiment mit automatisiertem maschinellem Lernen zu erstellen, muss das Datenschema für das neue Experiment mit dem Schema der Daten übereinstimmen, die im ursprünglichen Experiment verwendet wurden. Andernfalls wird eine Fehlermeldung ähnlich den folgenden Ergebnissen ausgegeben: Erfahren Sie mehr über das Bearbeiten und Übermitteln von Experimenten über die Studio-Benutzeroberfläche.

Fehlermeldung für Experimente ohne Vision: Schema mismatch error: (an) additional column(s): "Column1: String, Column2: String, Column3: String", (a) missing column(s)

Fehlermeldung für Vision-Datasets: Schema mismatch error: (an) additional column(s): "dataType: String, dataSubtype: String, dateTime: Date, category: String, subcategory: String, status: String, address: String, latitude: Decimal, longitude: Decimal, source: String, extendedProperties: String", (a) missing column(s): "image_url: Stream, image_details: DataRow, label: List" Vision dataset error(s): Vision dataset should have a target column with name 'label'. Vision dataset should have labelingProjectType tag with value as 'Object Identification (Bounding Box)'.

Databricks

Siehe Konfigurieren eines Experiments für automatisiertes maschinelles Lernen mit Databricks (Azure Machine Learning SDK v1).

Prognose-R2-Score ist immer 0 (null)

Dieses Problem tritt auf, wenn die bereitgestellten Trainingsdaten Zeitreihen enthalten, die für die letzten n_cv_splits + forecasting_horizon Datenpunkte den gleichen Wert aufweisen.

Wenn dieses Muster in Ihrer Zeitreihe erwartet wird, können Sie die primäre Metrik in die normalisierte mittlere quadratische Gesamtabweichung ändern.

Fehler bei der Bereitstellung

Bei SDK-Versionen bis einschließlich 1.18.0 kann bei dem für die Bereitstellung erstellten Basisimage der folgende Fehler auftreten: ImportError: cannot import name cached_property from werkzeug.

Mit den folgenden Schritten können Sie das Problem umgehen:

Herunterladen des Modellpakets
Entzippen Sie das Paket.
Bereitstellen mithilfe der entzippten Ressourcen

Azure Functions-Anwendung

Azure Functions-Anwendungen werden beim automatisierten ML derzeit nicht unterstützt.

Fehler für Beispielnotebook

Wenn bei einem Beispielnotebook ein Fehler aufgrund einer fehlenden Eigenschaft, Methode oder Bibliothek auftritt, gehen Sie folgendermaßen vor:

Stellen Sie sicher, dass im Jupyter Notebook der richtige Kernel ausgewählt wurde. Der Kernel wird oben rechts auf der Seite des Notebooks angezeigt. Der Standardwert lautet azure_automl. Der Kernel wird als Teil des Notebooks gespeichert. Wenn Sie zu einer neuen Conda-Umgebung wechseln, müssen Sie den neuen Kernel im Notebook auswählen.
- Bei Azure Notebooks sollte Python 3.6 verwendet werden.
- Bei lokalen Conda-Umgebungen sollte es sich um den Namen der Conda-Umgebung handeln, die Sie in „automl_setup“ angegeben haben.
Stellen Sie sicher, dass das Notebook auf die von Ihnen verwendete SDK-Version ausgelegt ist.
- Überprüfen Sie die SDK-Version, indem Sie azureml.core.VERSION in einer Jupyter Notebook-Zelle ausführen.
- Mit den folgenden Schritten können Sie die vorherige Version der Beispielnotebooks von GitHub herunterladen:
  1. Wählen Sie die Schaltfläche Branch aus.
  2. Navigieren Sie zur Registerkarte Tags.
  3. Wählen Sie die Version aus.

Experimentdrosselung

Bei mehr als 100 automatisierten ML-Experimenten kann dies dazu führen, dass neue automatisierte ML-Experimente lange Laufzeiten aufweisen.

VNet-Firewall-Fehler beim Herunterladen von Einstellungen

Wenn Sie sich in einem virtuellen Netzwerk (VNet) befinden, treten möglicherweise Modelldownloadfehler beim Verwenden von AutoML NLP auf. Dies liegt daran, dass der Netzwerkdatenverkehr daran gehindert wird, die Modelle und Tokenizer aus Azure CDN herunterzuladen. Um dies zu entsperren, lassen Sie bitte die folgenden URLs in der Einstellung „Anwendungsregeln“ der VNet-Firewallrichtlinie zu:

aka.ms
https://automlresources-prod.azureedge.net

Folgen Sie den Anweisungen hier, um die Firewalleinstellungen zu konfigurieren.

Anweisungen zum Konfigurieren von Arbeitsbereichen in VNets finden Sie hier.

Nächste Schritte

Erfahren Sie mehr über das Trainieren eines Regressionsmodells mit automatisiertem maschinellem Lernen und das Trainieren mit automatisiertem maschinellem Lernen auf einer Remoteressource.
Lernen Sie, wie und wo Sie Modelle bereitstellen können.

Share via