TensorFlow Klasse

Stellt eine Schätzung für schulungen in TensorFlow-Experimenten dar.

VERALTET. Verwenden Sie das ScriptRunConfig Objekt mit Ihrer eigenen definierten Umgebung oder einer der kuratierten Azure ML TensorFlow-Umgebungen. Eine Einführung in das Konfigurieren des TensorFlow-Experiments mit ScriptRunConfig finden Sie unter Train TensorFlow-Modelle im Maßstab mit Azure Machine Learning.

Unterstützte Versionen: 1.10, 1.12, 1.13, 2.0, 2.1, 2.2

Initialisieren Sie einen TensorFlow-Schätzer.

Docker run reference. :type shm_size: str :p aram resume_from: Der Datenpfad mit den Prüfpunkt- oder Modelldateien, aus denen das Experiment fortgesetzt werden soll. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: Die maximal zulässige Zeit für die Ausführung. Azure ML versucht automatisch,

abbrechen, wenn die Ausführung länger dauert als dieser Wert.

Konstruktor

TensorFlow(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, worker_count=1, parameter_server_count=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameter

Name	Beschreibung
source_directory Erforderlich	str Ein lokales Verzeichnis, das Experimentkonfigurationsdateien enthält.
compute_target Erforderlich	AbstractComputeTarget oder str Das Computeziel, in dem die Schulung stattfinden wird. Dies kann entweder ein Objekt oder die Zeichenfolge "local" sein.
vm_size Erforderlich	str Die VM-Größe des Computeziels, das für die Schulung erstellt wird. Unterstützte Werte: Eine beliebige Größe eines virtuellen Azure-Computers.
vm_priority Erforderlich	str Die VM-Priorität des Computeziels, das für die Schulung erstellt wird. Wenn nicht angegeben, wird "dedicated" verwendet. Unterstützte Werte: 'dedicated' und 'lowpriority'. Dies wird nur wirksam, wenn die `vm_size param` Eingabe angegeben wird.
entry_script Erforderlich	str Der relative Pfad zur Datei, die das Schulungsskript enthält.
script_params Erforderlich	dict Ein Wörterbuch mit Befehlszeilenargumenten, das an das in `entry_script`der Datei angegebene Schulungsskript übergeben werden soll.
node_count Erforderlich	int Die Anzahl der Knoten im Computeziel, das für die Schulung verwendet wird. Nur das AmlCompute Ziel wird für verteilte Schulungen unterstützt (`node_count`> 1).
process_count_per_node Erforderlich	int Bei Verwendung des MPI wird die Anzahl der Prozesse pro Knoten verwendet.
worker_count Erforderlich	int Bei Verwendung des Parameterservers für verteilte Schulungen die Anzahl der Workerknoten. VERALTET. Geben Sie als Teil des `distributed_training` Parameters an.
parameter_server_count Erforderlich	int Bei Verwendung des Parameterservers für verteilte Schulungen die Anzahl der Parameterserverknoten.
distributed_backend Erforderlich	str Das Kommunikations-Back-End für verteilte Schulungen. VERALTET. Verwenden Sie den Parameter `distributed_training`. Unterstützte Werte: "mpi" und "ps". "mpi" stellt MPI/Horovod und "ps" für Parameter Server dar. Dieser Parameter ist erforderlich, wenn einer von `node_count`, `process_count_per_node`, , `worker_count`oder `parameter_server_count`> 1. Im Fall von "ps" sollte die Summe von `worker_count` und `parameter_server_count` sollte kleiner oder gleich `node_count` * sein (Anzahl der CPUs oder GPUs pro Knoten) Wenn `node_count` == 1 und `process_count_per_node` == 1, wird kein Back-End verwendet, es sei denn, das Back-End ist explizit festgelegt. Nur das AmlCompute Ziel wird für verteilte Schulungen unterstützt.
distributed_training Erforderlich	ParameterServer oder Mpi Parameter zum Ausführen eines verteilten Schulungsauftrags. Zum Ausführen eines verteilten Auftrags mit Parameter Server-Back-End verwenden Sie das ParameterServer Objekt, um anzugeben `worker_count` und `parameter_server_count`. Die Summe der `worker_count` Parameter und der `parameter_server_count` Parameter sollte kleiner oder gleich `node_count` * sein (die Anzahl der CPUs oder GPUs pro Knoten). Verwenden Sie zum Ausführen eines verteilten Auftrags mit MPI-Back-End das Mpi Objekt, um anzugeben `process_count_per_node`.
use_gpu Erforderlich	bool Gibt an, ob die Umgebung, in der das Experiment ausgeführt werden soll, GPUs unterstützen soll. Wenn true, wird ein GPU-basiertes Standard-Docker-Image in der Umgebung verwendet. Bei "false" wird ein CPU-basiertes Image verwendet. Standardmäßige Docker-Images (CPU oder GPU) werden nur verwendet, wenn der `custom_docker_image` Parameter nicht festgelegt ist. Diese Einstellung wird nur in Docker-fähigen Computezielen verwendet.
use_docker Erforderlich	bool Gibt an, ob die Umgebung, in der das Experiment ausgeführt werden soll, Docker-basiert sein soll.
custom_docker_base_image Erforderlich	str Der Name des Docker-Images, aus dem das für Schulungen zu verwendende Image erstellt wird. VERALTET. Verwenden Sie den Parameter `custom_docker_image`. Wenn nicht festgelegt, wird ein CPU-basiertes Standardimage als Basisimage verwendet.
custom_docker_image Erforderlich	str Der Name des Docker-Images, aus dem das für Schulungen zu verwendende Image erstellt wird. Wenn nicht festgelegt, wird ein CPU-basiertes Standardimage als Basisimage verwendet.
image_registry_details Erforderlich	ContainerRegistry Die Details der Docker-Imageregistrierung.
user_managed Erforderlich	bool Gibt an, ob Azure ML eine vorhandene Python-Umgebung wiederverwendet. Bei "false" erstellt Azure ML eine Python-Umgebung basierend auf der Conda-Abhängigkeitsspezifikation.
conda_packages Erforderlich	list Eine Liste der Zeichenfolgen, die Conda-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen.
pip_packages Erforderlich	list Eine Liste der Zeichenfolgen, die Pip-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen.
conda_dependencies_file_path Erforderlich	str Eine Zeichenfolge, die den relativen Pfad zur Conda-Abhängigkeits-Yaml-Datei darstellt. Wenn angegeben, installiert Azure ML keine Framework-bezogenen Pakete. VERALTET. Verwenden Sie den Parameter `conda_dependencies_file`.
pip_requirements_file_path Erforderlich	str Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt. Dies kann in Kombination mit dem `pip_packages` Parameter bereitgestellt werden. VERALTET. Verwenden Sie den Parameter `pip_requirements_file`.
conda_dependencies_file Erforderlich	str Eine Zeichenfolge, die den relativen Pfad zur Conda-Abhängigkeits-Yaml-Datei darstellt. Wenn angegeben, installiert Azure ML keine Framework-bezogenen Pakete.
pip_requirements_file Erforderlich	str Eine Zeichenfolge, die den relativen Pfad zur Pip-Anforderungstextdatei darstellt. Dies kann in Kombination mit dem `pip_packages` Parameter bereitgestellt werden.
environment_variables Erforderlich	dict Ein Wörterbuch mit Namen und Werten für Umgebungsvariablen. Diese Umgebungsvariablen werden für den Prozess festgelegt, bei dem Benutzerskript ausgeführt wird.
environment_definition Erforderlich	Environment Die Umgebungsdefinition für das Experiment. Es enthält PythonSection-, DockerSection- und Umgebungsvariablen. Jede Umgebungsoption, die nicht direkt über andere Parameter für die Estimator-Konstruktion verfügbar gemacht wird, kann mit diesem Parameter festgelegt werden. Wenn dieser Parameter angegeben ist, hat er Vorrang vor anderen umgebungsbezogenen Parametern wie `use_gpu`, , `custom_docker_image`, oder `conda_packagespip_packages`. Bei diesen ungültigen Kombinationen werden Fehler gemeldet.
inputs Erforderlich	list Eine Liste von objekten, DataReference die DatasetConsumptionConfig als Eingabe verwendet werden sollen.
source_directory_data_store Erforderlich	Datastore Der Sicherungsdatenspeicher für die Projektfreigabe.
shm_size Erforderlich	str Die Größe des freigegebenen Speicherblocks des Docker-Containers. Wenn nicht festgelegt, wird der Standard-azureml.core.environment._DEFAULT_SHM_SIZE verwendet. Weitere Informationen finden Sie in der Referenz zur Docker-Ausführung.
resume_from Erforderlich	DataPath Der Datenpfad, der die Prüfpunkt- oder Modelldateien enthält, aus denen das Experiment fortgesetzt werden soll.
max_run_duration_seconds Erforderlich	int Die maximal zulässige Zeit für die Ausführung. Azure ML versucht, die Ausführung automatisch abzubrechen, wenn dieser Wert länger dauert.
framework_version Erforderlich	str Die TensorFlow-Version, die zum Ausführen von Schulungscode verwendet werden soll. Wenn keine Version bereitgestellt wird, verwendet der Schätzer standardmäßig die neueste Version, die von Azure ML unterstützt wird. Dient `TensorFlow.get_supported_versions()` zum Zurückgeben einer Liste, um eine Liste aller Versionen abzurufen, die das aktuelle Azure ML SDK unterstützt haben.
source_directory Erforderlich	str Ein lokales Verzeichnis, das Experimentkonfigurationsdateien enthält.
compute_target Erforderlich	AbstractComputeTarget oder str Das Computeziel, in dem die Schulung stattfinden wird. Dies kann entweder ein Objekt oder die Zeichenfolge "local" sein.
vm_size Erforderlich	str Die VM-Größe des Computeziels, das für die Schulung erstellt wird. Unterstützte Werte: Eine beliebige Größe eines virtuellen Azure-Computers.
vm_priority Erforderlich	str Die VM-Priorität des Computeziels, das für die Schulung erstellt wird. Wenn nicht angegeben, wird "dedicated" verwendet. Unterstützte Werte: 'dedicated' und 'lowpriority'. Dies wird nur wirksam, wenn die `vm_size param` Eingabe angegeben wird.
entry_script Erforderlich	str Der relative Pfad zur Datei, die das Schulungsskript enthält.
script_params Erforderlich	dict Ein Wörterbuch mit Befehlszeilenargumenten, das an das in `entry_script`der Datei angegebene Tne-Schulungsskript übergeben werden soll.
node_count Erforderlich	int Die Anzahl der Knoten im Computeziel, das für die Schulung verwendet wird. Nur das AmlCompute Ziel wird für verteilte Schulungen unterstützt (`node_count`> 1).
process_count_per_node Erforderlich	int Bei Verwendung des MPI wird die Anzahl der Prozesse pro Knoten verwendet.
worker_count Erforderlich	int Bei Verwendung des Parameterservers gibt es die Anzahl der Workerknoten. VERALTET. Geben Sie als Teil des `distributed_training` Parameters an.
parameter_server_count Erforderlich	int Bei Verwendung des Parameterservers gibt es die Anzahl der Parameterserverknoten.
distributed_backend Erforderlich	str Das Kommunikations-Back-End für verteilte Schulungen. VERALTET. Verwenden Sie den Parameter `distributed_training`. Unterstützte Werte: "mpi" und "ps". "mpi" stellt MPI/Horovod und "ps" für Parameter Server dar. Dieser Parameter ist erforderlich, wenn einer von `node_count`, `process_count_per_node`, , `worker_count`oder `parameter_server_count`> 1. Im Fall von "ps" sollte die Summe von `worker_count` und `parameter_server_count` sollte kleiner oder gleich `node_count` * sein (Anzahl der CPUs oder GPUs pro Knoten) Wenn `node_count` == 1 und `process_count_per_node` == 1, wird kein Back-End verwendet, es sei denn, das Back-End ist explizit festgelegt. Nur das AmlCompute Ziel wird für verteilte Schulungen unterstützt. wird für verteilte Schulungen unterstützt.
distributed_training Erforderlich	ParameterServer oder Mpi Parameter zum Ausführen eines verteilten Schulungsauftrags. Verwenden Sie ParameterServer zum Ausführen eines verteilten Auftrags mit dem Parameter Server-Back-End das Objekt, um anzugeben `worker_count` und `parameter_server_count`. Die Summe der `worker_count` Parameter und der `parameter_server_count` Parameter sollte kleiner oder gleich `node_count` * sein (die Anzahl der CPUs oder GPUs pro Knoten). Verwenden Sie Mpi zum Ausführen eines verteilten Auftrags mit MPI-Back-End das Objekt, um anzugeben `process_count_per_node`.
use_gpu Erforderlich	bool Gibt an, ob die Umgebung, in der das Experiment ausgeführt werden soll, GPUs unterstützen soll. Wenn true, wird ein GPU-basiertes Standard-Docker-Image in der Umgebung verwendet. Bei "false" wird ein CPU-basiertes Image verwendet. Standardmäßige Docker-Images (CPU oder GPU) werden nur verwendet, wenn `custom_docker_image` der Parameter nicht festgelegt ist. Diese Einstellung wird nur in Docker-fähigen Computezielen verwendet.
use_docker Erforderlich	bool Gibt an, ob die Umgebung, in der das Experiment ausgeführt werden soll, Docker-basiert sein soll.
custom_docker_base_image Erforderlich	str Der Name des Docker-Images, aus dem das für Schulungen zu verwendende Image erstellt wird. VERALTET. Verwenden Sie den Parameter `custom_docker_image`. Wenn nicht festgelegt, wird ein CPU-basiertes Standardimage als Basisimage verwendet.
custom_docker_image Erforderlich	str Der Name des Docker-Images, aus dem das für Schulungen zu verwendende Image erstellt wird. Wenn nicht festgelegt, wird ein CPU-basiertes Standardimage als Basisimage verwendet.
image_registry_details Erforderlich	ContainerRegistry Die Details der Docker-Imageregistrierung.
user_managed Erforderlich	bool Gibt an, ob Azure ML eine vorhandene Python-Umgebung wiederverwendet. Bei "false" erstellt Azure ML eine Python-Umgebung basierend auf der Conda-Abhängigkeitsspezifikation.
conda_packages Erforderlich	list Eine Liste der Zeichenfolgen, die Conda-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen.
pip_packages Erforderlich	list Eine Liste der Zeichenfolgen, die Pip-Pakete darstellen, die der Python-Umgebung für das Experiment hinzugefügt werden sollen.
conda_dependencies_file_path Erforderlich	str Der relative Pfad zur Conda-Abhängigkeiten yaml-Datei. Wenn angegeben, installiert Azure ML keine Framework-bezogenen Pakete. VERALTET. Verwenden Sie den Parameter `conda_dependencies_file`.
pip_requirements_file_path Erforderlich	str Der relative Pfad zur Pip-Anforderungstextdatei. Dies kann in Kombination mit dem `pip_packages` Parameter bereitgestellt werden. VERALTET. Verwenden Sie den Parameter `pip_requirements_file`.
environment_variables Erforderlich	dict Ein Wörterbuch mit Namen und Werten für Umgebungsvariablen. Diese Umgebungsvariablen werden für den Prozess festgelegt, bei dem Benutzerskript ausgeführt wird.
conda_dependencies_file Erforderlich	str Eine Zeichenfolge, die den relativen Pfad zur Conda-Abhängigkeits-Yaml-Datei darstellt. Wenn angegeben, installiert Azure ML keine Framework-bezogenen Pakete.
pip_requirements_file Erforderlich	str Der relative Pfad zur Pip-Anforderungstextdatei. Dies kann in Kombination mit dem `pip_packages` Parameter bereitgestellt werden.
environment_variables Erforderlich	Ein Wörterbuch mit Namen und Werten für Umgebungsvariablen. Diese Umgebungsvariablen werden für den Prozess festgelegt, bei dem Benutzerskript ausgeführt wird.
environment_definition Erforderlich	Environment Die Umgebungsdefinition für das Experiment. Es enthält PythonSection-, DockerSection- und Umgebungsvariablen. Jede Umgebungsoption, die nicht direkt über andere Parameter für die Estimator-Konstruktion verfügbar gemacht wird, kann mit diesem Parameter festgelegt werden. Wenn dieser Parameter angegeben wird, hat er Vorrang vor anderen umgebungsbezogenen Parametern wie `use_gpu`, , `custom_docker_image`, , `conda_packages`oder `pip_packages`. Bei diesen ungültigen Kombinationen werden Fehler gemeldet.
inputs Erforderlich	list Eine Liste der azureml.data.data_reference. DataReference-Objekte, die als Eingabe verwendet werden sollen.
source_directory_data_store Erforderlich	str Der Sicherungsdatenspeicher für die Projektfreigabe.
shm_size Erforderlich	Die Größe des freigegebenen Speicherblocks des Docker-Containers. Wenn nicht festgelegt, ist der Standardwert azureml.core.environment._DEFAULT_SHM_SIZE. Weitere Informationen finden Sie unter
framework_version Erforderlich	str Die TensorFlow-Version, die zum Ausführen von Schulungscode verwendet werden soll. Wenn keine Version bereitgestellt wird, verwendet der Schätzer standardmäßig die neueste Version, die von Azure ML unterstützt wird. Verwenden Sie TensorFlow.get_supported_versions(), um eine Liste zurückzugeben, um eine Liste aller Versionen abzurufen, die das aktuelle Azure ML SDK unterstützt haben.
_enable_optimized_mode Erforderlich	bool Aktivieren Sie den inkrementellen Umgebungsbuild mit vordefinierten Frameworkimages für eine schnellere Vorbereitung der Umgebung. Ein vordefiniertes Frameworkimage basiert auf Azure ML-Standard-CPU-/GPU-Basisimages mit vorinstallierten Frameworkabhängigkeiten.
_disable_validation Erforderlich	bool Deaktivieren Sie die Skriptüberprüfung vor dem Ausführen der Übermittlung. Der Standardwert ist True.
_show_lint_warnings Erforderlich	bool Anzeigen von Skript-Lintingwarnungen. Der Standardwert ist False.
_show_package_warnings Erforderlich	bool Paketüberprüfungswarnungen anzeigen. Der Standardwert ist False.

Hinweise

Beim Übermitteln eines Schulungsauftrags führt Azure ML Ihr Skript in einer Conda-Umgebung in einem Docker-Container aus. Die TensorFlow-Container haben die folgenden Abhängigkeiten installiert.

Abhängigkeiten | TensorFlow 1.10/1.12 | TensorFlow 1.13 | TF 2.0/2.1/2.2 | ———————————— | ——————– | ————— | —————— | Python | 3.6.2 | 3.6.2 | 3.6.2 | CUDA (nur GPU-Bild) | 9.0 | 10.0 | 10.0 | cuDNN (nur GPU-Bild) | 7.6.3 | 7.6.3 | 7.6.3 | NCCL (nur GPU-Bild) | 2.4.8 | 2.4.8 | 2.4.8 | azureml-defaults | Neueste | Neueste | Neueste | azureml-dataset-runtime[fuse,pandas] | Neueste | Neueste | Neueste | IntelMpi | 2018.3.222 | 2018.3.222 | —- | OpenMpi | —- | —- | 3.1.2 | horovod | 0.15.2 | 0.16.1 | 0.18.1/0.19.1/0.19.5 | miniconda | 4.5.11 | 4.5.11 | 4.5.11 | Tensorflow | 1.10.0/1.12.0 | 1.13.1 | 2.0.0/2.1.0/2.2.0 | git | 2.7.4 | 2.7.4 | 2.7.4 |

Die v1 Docker-Images erweitern Ubuntu 16.04. Die v2 Docker-Images erweitern Ubuntu 18.04.

Um zusätzliche Abhängigkeiten zu installieren, können Sie entweder den Parameter oder pip_packages den conda_packages Parameter verwenden. Oder Sie können den Parameter oder pip_requirements_file den conda_dependencies_file Parameter angeben. Alternativ können Sie ein eigenes Image erstellen und den custom_docker_image Parameter an den Schätzwertkonstruktor übergeben.

Weitere Informationen zu Docker-Containern, die in TensorFlow-Schulungen verwendet werden, finden Sie unter https://github.com/Azure/AzureML-Containers.

Die TensorFlow-Klasse unterstützt zwei Methoden der verteilten Schulung:

MPI-basierte verteilte Schulung mit dem

Horovod-Framework
Native verteilter TensorFlow

Beispiele und weitere Informationen zur Verwendung von TensorFlow in verteilten Schulungen finden Sie im Lernprogramm Train and register TensorFlow models at scale with Azure Machine Learning.

Attribute

DEFAULT_VERSION

DEFAULT_VERSION = '1.13'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'TensorFlow'

Feedback

War diese Seite hilfreich?