Benutzerdefinierte Spracherkennungs-Container mit Docker

Artikel
10/16/2024

Der Container für die benutzerdefinierte Spracherkennung transkribiert Sprache in Echtzeit oder Batchaudioaufzeichnungen mit Zwischenergebnissen. Sie können ein benutzerdefiniertes Modell verwenden, das Sie im Custom Speech-Portal erstellt haben. In diesem Artikel erfahren Sie, wie Sie einen Container für die benutzerdefinierte Spracherkennung herunterladen, installieren und ausführen.

Weitere Informationen zu den Voraussetzungen, zum Überprüfen, ob ein Container ausgeführt wird, Ausführen mehrerer Container auf demselben Host und Ausführen nicht verbundener Container finden Sie unter Installieren und Ausführen von Docker-Containern für die APIs des Speech-Diensts.

Containerimages

Das Containerimage für die benutzerdefinierte Spracherkennung für alle unterstützten Versionen und Gebietsschemas finden Sie im Microsoft Container Registry (MCR)-Syndikat. Es befindet sich im Repository azure-cognitive-services/speechservices/ und trägt den Namen custom-speech-to-text.

Der vollqualifizierte Containerimagename lautet mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text. Fügen Sie entweder eine bestimmte Version oder zum Abrufen der aktuellen Version :latest an.

Version	`Path`
Neueste Version	`mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text:latest`
4.10.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text:4.10.0-amd64`

Alle Tags, mit Ausnahme von latest, haben das folgende Format und beachten die Groß-/Kleinschreibung:

<major>.<minor>.<patch>-<platform>-<prerelease>

Hinweis

Die Werte locale und voice für benutzerdefinierte Spracherkennungs-Container werden durch das benutzerdefinierte Modell bestimmt, das vom Container erfasst wird.

Die Tags sind der Einfachheit halber auch im JSON-Format verfügbar. Der Text enthält den Containerpfad und eine Liste mit Tags. Die Tags sind nicht nach Version sortiert, "latest" ist jedoch wie im folgenden Codeschnipsel gezeigt immer am Ende der Liste enthalten:

{
  "name": "azure-cognitive-services/speechservices/custom-speech-to-text",
  "tags": [
    <--redacted for brevity-->
    "4.4.0-amd64",
    "4.5.0-amd64",
    "4.6.0-amd64",
    "4.7.0-amd64",
    "4.8.0-amd64",
    "4.9.0-amd64",
    "4.10.0-amd64",
    "latest"
  ]
}

Abrufen des Containerimages mit dem Befehl „docker pull“

Sie müssen die Voraussetzungen erfüllen (einschließlich der Hardwareanforderungen). Sehen Sie sich auch die empfohlene Zuordnung von Ressourcen für die einzelnen Speech-Container an.

Verwenden Sie den Befehl docker pull, um ein Containerimage aus Microsoft Container Registry herunterzuladen:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text:latest

Hinweis

Die Werte für locale und voice für benutzerdefinierte Speech-Container werden durch das benutzerdefinierte Modell bestimmt, das vom Container erfasst wird.

Abrufen der Modell-ID

Bevor Sie den Container ausführen können, müssen Sie die Modell-ID Ihres benutzerdefinierten Modells oder eine Basismodell-ID kennen. Wenn Sie den Container ausführen, geben Sie eine der Modell-IDs zum Herunterladen und Verwenden an.

ID eines benutzerdefinierten Modells
ID eines Basismodells

Das benutzerdefinierte Modell muss mithilfe von Speech Studio trainiert werden. Informationen zum Abrufen der Modell-ID finden Sie unter Lebenszyklus eines Custom Speech-Modells.

Screenshot: Custom Speech-Trainingsseite

Rufen Sie die Modell-ID ab, um diese als Argument für den ModelId-Parameter des docker run-Befehls zu verwenden.

Screenshot: Custom Speech-Modelldetails

Sie können die Informationen zu den verfügbaren Basismodellen mit der Option BaseModelLocale={LOCALE} abrufen. Diese Option verschafft Ihnen eine Liste der verfügbaren Basismodelle für das betreffende Gebietsschema unter Ihrem Abrechnungskonto.

Zum Abrufen der Basismodell-IDs verwenden Sie den Befehl docker run. Beispiel:

docker run --rm -it \
mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text \
BaseModelLocale={LOCALE} \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Dieser Befehl überprüft das Containerimage und gibt die verfügbaren Basismodelle des Zielgebietsschemas zurück.

Hinweis

Obwohl Sie den Befehl docker run verwenden, wird der Container nicht für den Dienst gestartet.

Die Ausgabe enthält eine Liste der Basismodelle mit Angaben zu Gebietsschema, Modell-ID und Erstellungsdatum/-uhrzeit. Beispiel:

Checking available base model for en-us
2020/10/30 21:54:20 [Info] Searching available base models for en-us
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2016-11-04T08:23:42Z, Id: a3d8aab9-6f36-44cd-9904-b37389ce2bfa
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2016-11-04T12:01:02Z, Id: cc7826ac-5355-471d-9bc6-a54673d06e45
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2017-08-17T12:00:00Z, Id: a1f8db59-40ff-4f0e-b011-37629c3a1a53
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2018-04-16T11:55:00Z, Id: c7a69da3-27de-4a4b-ab75-b6716f6321e5
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2018-09-21T15:18:43Z, Id: da494a53-0dad-4158-b15f-8f9daca7a412
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2018-10-19T11:28:54Z, Id: 84ec130b-d047-44bf-a46d-58c1ac292ca7
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2018-11-26T07:59:09Z, Id: ee5c100f-152f-4ae5-9e9d-014af3c01c56
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2018-11-26T09:21:55Z, Id: d04959a6-71da-4913-9997-836793e3c115
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2019-01-11T10:04:19Z, Id: 488e5f23-8bc5-46f8-9ad8-ea9a49a8efda
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2019-02-18T14:37:57Z, Id: 0207b3e6-92a8-4363-8c0e-361114cdd719
2020/10/30 21:54:21 [Info] [Base model] Locale: en-us, CreatedDate: 2019-03-03T17:34:10Z, Id: 198d9b79-2950-4609-b6ec-f52254074a05
2020/10/30 21:54:21 [Fatal] Please run this tool again and assign --modelId '<one above base model id>'. If no model id listed above, it means currently there is no available base model for en-us

Herunterladen der Anzeigemodelle

Bevor Sie den Container ausführen, können Sie optional die Informationen zu den verfügbaren Anzeigemodellen abrufen und diese Modelle in Ihren Spracherkennungs-Container herunterladen. Dadurch erhalten Sie eine deutlich verbesserte endgültige Anzeigeausgabe. Der Download der Anzeigemodelle ist ab Version 3.1.0 des Containers für die benutzerdefinierte Spracherkennung verfügbar.

Hinweis

Obwohl Sie den Befehl docker run verwenden, wird der Container nicht für den Dienst gestartet.

Sie können die folgenden Anzeigemodelltypen abfragen oder herunterladen: Neubewertung (Rescore), Interpunktion (Punct), Neusegmentierung (Resegment) und wfstitn (Wfstitn). Andernfalls können Sie die Option FullDisplay (mit oder ohne die anderen Typen) verwenden, um alle Arten von Anzeigemodellen abzufragen oder herunterzuladen.

Legen Sie BaseModelLocale fest, um das neueste verfügbare Anzeigemodell für das Zielgebietsschema abzufragen. Wenn Sie mehrere Anzeigemodelltypen einbeziehen, gibt der Befehl die neuesten verfügbaren Anzeigemodelle für jeden Typ zurück. Beispiel:

docker run --rm -it \
mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text \
Punct Rescore Resegment Wfstitn \   # Specify `FullDisplay` or a space-separated subset of display models
BaseModelLocale={LOCALE} \           
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Legen Sie DisplayLocale fest, um das neueste verfügbare Anzeigemodell für das Zielgebietsschema herunterzuladen. Wenn Sie DisplayLocale festlegen, müssen Sie auch FullDisplay oder eine durch Leerzeichen getrennte Teilmenge von Anzeigemodellen angeben. Der Befehl lädt das neueste verfügbare Anzeigemodell für jeden angegebenen Typ herunter. Beispiel:

docker run --rm -it \
mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text \
Punct Rescore Resegment Wfstitn \   # Specify `FullDisplay` or a space-separated subset of display models
DisplayLocale={LOCALE} \           
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Legen Sie einen Modell-ID-Parameter fest, um ein bestimmtes Anzeigemodell herunterzuladen: Neubewertung (RescoreId), Interpunktion (PunctId), Neusegmentierung (ResegmentId) oder wfstitn (WfstitnId). Dies ähnelt dem Herunterladen eines Basismodells über den Parameter ModelId. Zum Herunterladen eines Anzeigemodells für die Neubewertung können Sie beispielsweise den folgenden Befehl mit dem Parameter RescoreId verwenden:

docker run --rm -it \
mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text \
RescoreId={RESCORE_MODEL_ID} \         
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Hinweis

Wenn Sie mehrere Abfrage- oder Downloadparameter festlegen, priorisiert der Befehl in dieser Reihenfolge: BaseModelLocale, Modell-ID und dann DisplayLocale (gilt nur für Anzeigemodelle).

Ausführen des Containers mit „docker run“

Verwenden Sie den Befehl docker run, um den Container auszuführen.

Benutzerdefinierte Spracherkennung
Nicht verbundene benutzerdefinierte Spracherkennung

Die folgende Tabelle zeigt die verschiedenen docker run-Parameter und die entsprechenden Beschreibungen:

Parameter	Beschreibung
`{VOLUME_MOUNT}`	Die Volumebereitstellung des Hostcomputers, die Docker zum dauerhaften Speichern des benutzerdefinierten Modells verwendet. Beispiel: `c:\CustomSpeech`, wobei sich das Laufwerk `c:\` auf dem Hostcomputer befindet.
`{MODEL_ID}`	Die ID des benutzerdefinierten Sprachmodells oder Basismodells. Weitere Informationen finden Sie unter Abrufen der Modell-ID.
`{ENDPOINT_URI}`	Der Endpunkt ist zur Messung und Abrechnung erforderlich. Weitere Informationen finden Sie unter Abrechnungsargumente.
`{API_KEY}`	Der API-Schlüssel ist erforderlich. Weitere Informationen finden Sie unter Abrechnungsargumente.

Wenn Sie den benutzerdefinierten Spracherkennungs-Container ausführen, konfigurieren Sie Port, Arbeitsspeicher und CPU gemäß den Anforderungen und Empfehlungen für benutzerdefinierte Spracherkennungs-Container.

Hier sehen Sie einen Beispielbefehl docker run mit Platzhalterwerten. Sie müssen die Werte VOLUME_MOUNT, MODEL_ID, ENDPOINT_URI und API_KEY angeben:

docker run --rm -it -p 5000:5000 --memory 8g --cpus 4 \
-v {VOLUME_MOUNT}:/usr/local/models \
mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text \
ModelId={MODEL_ID} \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Dieser Befehl:

Führt einen benutzerdefinierten Spracherkennungs-Container aus dem Containerimage aus.
Ordnet 4 CPU-Kerne und 8 GB Arbeitsspeicher zu.
Lädt das benutzerdefinierte Modell für die Spracherkennung aus der Volumebereitstellung für die Eingabe, z. B. C:\CustomSpeech.
Macht den TCP-Port 5000 verfügbar und ordnet eine Pseudo-TTY-Verbindung für den Container zu.
Lädt das Modell anhand der ModelId herunter (sofern diese in der Volumebereitstellung nicht gefunden wird).
Wenn das benutzerdefinierte Modell zuvor bereits heruntergeladen wurde, wird die ModelId ignoriert.
Entfernt den Container automatisch, nachdem er beendet wurde. Das Containerimage ist auf dem Hostcomputer weiterhin verfügbar.

Weitere Informationen zur Verwendung von docker run mit Speech-Containern finden Sie unter Installieren und Ausführen von Docker-Containern für die APIs des Speech-Diensts.

Um nicht (mit dem Internet) verbundene Container auszuführen, müssen Sie dieses Anforderungsformular übermitteln und auf die Genehmigung warten. Weitere Informationen zur Anwendung und zum Erwerb eines Mindestabnahmeplans für den Einsatz von Containern in nicht verbundenen Umgebungen finden Sie unter Verwenden von Containern in nicht verbundenen Umgebungen in der Dokumentation zu Azure KI Services.

Wenn Sie die Genehmigung erhalten haben, den Container ohne Internetverbindung auszuführen, verwenden Sie die im folgenden Beispiel mit Platzhalterwerten gezeigte Formatierung des Befehls docker run. Ersetzen Sie diese Platzhalterwerte durch eigene Werte.

Zur Vorbereitung und Konfiguration eines getrennten benutzerdefinierten Spracherkennungscontainers benötigen Sie zwei separate Speech-Ressourcen:

Eine reguläre Azure KI Services-Ressource, die entweder für die Verwendung des Tarifs S0 – Standard oder des Tarifplans Spracherkennung (benutzerdefiniert) mit Mindestabnahme konfiguriert ist. Diese wird verwendet, um Ihre benutzerdefinierten Sprachmodelle für die Verwendung in Ihrem Container zu trainieren, herunterzuladen und zu konfigurieren.
Eine Azure KI Services-Ressource, die für die Verwendung des Tarifs DC0-Mindestabnahme (getrennt) konfiguriert ist. Diese wird verwendet, um ihre getrennte Containerlizenzdatei herunterzuladen, die erforderlich ist, um den Container im getrennten Modus auszuführen.

Führen Sie die folgenden Schritte aus, um den Container in nicht verbundenen Umgebungen herunterzuladen und auszuführen.

Laden Sie ein Modell für den nicht verbundenen Container herunter. Verwenden Sie für diesen Schritt eine reguläre Azure KI Speech-Ressource, die entweder für die Verwendung des Tarifs S0 – Standard oder einen Mindestabnahmeplan für Spracherkennung (benutzerdefiniert) konfiguriert ist.
Laden Sie die Lizenz für den nicht verbundenen Container herunter. Verwenden Sie für diesen Schritt eine Azure KI Speech-Ressource, die zur Verwendung des Tarifs DC0-Mindestabnahme (getrennt) konfiguriert ist.
Führen Sie den nicht verbundenen Container für den Dienst aus. Verwenden Sie für diesen Schritt eine Azure KI Speech-Ressource, die zur Verwendung des Tarifs DC0-Mindestabnahme (getrennt) konfiguriert ist.

Herunterladen eines Modells für den nicht verbundenen Container

Verwenden Sie für diesen Schritt eine reguläre Azure KI Speech-Ressource, die entweder für die Verwendung des Tarifs S0 – Standard oder einen Mindestabnahmeplan für Spracherkennung (benutzerdefiniert) konfiguriert ist.

Die folgende Tabelle zeigt die verschiedenen docker run-Parameter und die entsprechenden Beschreibungen:

Parameter	Beschreibung
`{VOLUME_MOUNT}`	Die Volumebereitstellung des Hostcomputers, die Docker zum dauerhaften Speichern des benutzerdefinierten Modells verwendet. Beispiel: `c:\CustomSpeech`, wobei sich das Laufwerk `c:\` auf dem Hostcomputer befindet.
`{MODEL_ID}`	Die ID des benutzerdefinierten Sprachmodells oder Basismodells. Weitere Informationen finden Sie unter Abrufen der Modell-ID.
`{ENDPOINT_URI}`	Der Endpunkt ist zur Messung und Abrechnung erforderlich. Weitere Informationen finden Sie unter Abrechnungsargumente.
`{API_KEY}`	Der API-Schlüssel ist erforderlich. Weitere Informationen finden Sie unter Abrechnungsargumente.

Hier sehen Sie einen Beispielbefehl docker run mit Platzhalterwerten. Sie müssen die Werte VOLUME_MOUNT, MODEL_ID, ENDPOINT_URI und API_KEY angeben:

docker run --rm -it -p 5000:5000 --memory 8g --cpus 4 \
-v {VOLUME_MOUNT}:/usr/local/models \
mcr.microsoft.com/azure-cognitive-services/speechservices/custom-speech-to-text \
ModelId={MODEL_ID} \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Dieser Befehl:

Führt einen benutzerdefinierten Spracherkennungs-Container aus dem Containerimage aus.
Ordnet 4 CPU-Kerne und 8 GB Arbeitsspeicher zu.
Lädt das benutzerdefinierte Modell für die Spracherkennung aus der Volumebereitstellung für die Eingabe, z. B. C:\CustomSpeech.
Macht den TCP-Port 5000 verfügbar und ordnet eine Pseudo-TTY-Verbindung für den Container zu.
Lädt das Modell anhand der ModelId herunter (sofern diese in der Volumebereitstellung nicht gefunden wird).
Wenn das benutzerdefinierte Modell zuvor bereits heruntergeladen wurde, wird die ModelId ignoriert.
Entfernt den Container automatisch, nachdem er beendet wurde. Das Containerimage ist auf dem Hostcomputer weiterhin verfügbar.

Weitere Informationen zur Verwendung von docker run mit Speech-Containern finden Sie unter Installieren und Ausführen von Docker-Containern für die APIs des Speech-Diensts.

Herunterladen der Lizenz für den nicht verbundenen Container

Als Nächstes laden Sie Ihre nicht verbundene Lizenzdatei herunter. Der Parameter DownloadLicense=True in Ihrem docker run-Befehl lädt eine Lizenzdatei herunter, die es Ihrem Docker-Container ermöglicht, auch ohne Internetverbindung ausgeführt zu werden. Sie enthält auch ein Ablaufdatum, nach dem die Lizenzdatei nicht mehr für die Ausführung des Containers gültig ist.

Sie können eine Lizenzdatei nur mit dem entsprechenden Container und Modell verwenden, für die Sie eine Genehmigung erhalten haben. Sie können beispielweise keine Lizenzdatei für einen speech-to-text-Container mit einem neural-text-to-speech-Container verwenden.

Platzhalter	BESCHREIBUNG
`{IMAGE}`	Das Containerimage, das Sie verwenden möchten. Beispiel: `mcr.microsoft.com/azure-cognitive-services/custom-speech-to-text:latest`
`{LICENSE_MOUNT}`	Der Pfad, in den die Lizenz heruntergeladen und eingebunden wird. Beispiel: `/host/license:/path/to/license/directory`
`{MODEL_PATH}`	Der Pfad, an dem sich das Modell befindet. Beispiel: `/host/models:/usr/local/models`
`{ENDPOINT_URI}`	Der Endpunkt für Ihre Service Request-Authentifizierung. Sie finden ihn im Azure-Portal auf der Seite Key and endpoint (Schlüssel und Endpunkt) Ihrer Ressource. Beispiel: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Der Schlüssel für Ihre Speech-Ressource. Sie finden ihn im Azure-Portal auf der Seite Key and endpoint (Schlüssel und Endpunkt) Ihrer Ressource.
`{CONTAINER_LICENSE_DIRECTORY}`	Speicherort des Lizenzordners im lokalen Dateisystem des Containers. Beispiel: `/path/to/license/directory`

Verwenden Sie für diesen Schritt eine Azure KI Speech-Ressource, die zur Verwendung des Tarifs DC0-Mindestabnahme (getrennt) konfiguriert ist.

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
-v {MODEL_PATH} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

Ausführen des nicht verbundenen Containers

Nachdem die Lizenzdatei heruntergeladen wurde, können Sie den Container in einer nicht verbundenen Umgebung ausführen. Das folgende Beispiel zeigt die Formatierung des zu verwendenden docker run-Befehls mit Platzhalterwerten. Ersetzen Sie diese Platzhalterwerte durch eigene Werte.

Unabhängig davon, wo der Container ausgeführt wird, muss die Lizenzdatei in den Container eingebunden und der Speicherort des Lizenzordners im lokalen Dateisystem des Containers muss mit Mounts:License= angegeben werden. Außerdem muss eine Ausgabeeinbindung angegeben werden, sodass Einträge für die Abrechnung der Nutzung geschrieben werden können.

Platzhalter	BESCHREIBUNG
`{IMAGE}`	Das Containerimage, das Sie verwenden möchten. Beispiel: `mcr.microsoft.com/azure-cognitive-services/custom-speech-to-text:latest`
`{MEMORY_SIZE}`	Die geeignete Größe des Arbeitsspeichers, der für Ihren Container zugeordnet werden soll. Beispiel: `4g`
`{NUMBER_CPUS}`	Die geeignete Anzahl von CPUs, die für Ihren Container zugeordnet werden soll. Beispiel: `4`
`{LICENSE_MOUNT}`	Der Pfad, in den die Lizenz heruntergeladen und eingebunden wird. Beispiel: `/host/license:/path/to/license/directory`
`{MODEL_PATH}`	Der Pfad, an dem sich das Modell befindet. Beispiel: `/host/models:/usr/local/models`
`{OUTPUT_PATH}`	Der Ausgabepfad für die Protokollierung. Beispiel: `/host/output:/path/to/output/directory` Weitere Informationen finden Sie unter Nutzungsdatensätze in der Dokumentation zu Azure KI Services.
`{ENDPOINT_URI}`	Der Endpunkt für Ihre Service Request-Authentifizierung. Sie finden ihn im Azure-Portal auf der Seite Key and endpoint (Schlüssel und Endpunkt) Ihrer Ressource. Beispiel: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	Der Schlüssel für Ihre Speech-Ressource. Sie finden ihn im Azure-Portal auf der Seite Key and endpoint (Schlüssel und Endpunkt) Ihrer Ressource.
`{CONTAINER_LICENSE_DIRECTORY}`	Speicherort des Lizenzordners im lokalen Dateisystem des Containers. Beispiel: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	Speicherort des Ausgabeordners im lokalen Dateisystem des Containers. Beispiel: `/path/to/output/directory`

Verwenden Sie für diesen Schritt eine Azure KI Speech-Ressource, die zur Verwendung des Tarifs DC0-Mindestabnahme (getrennt) konfiguriert ist.

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
-v {MODEL_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Der Container für die benutzerdefinierte Spracherkennung enthält ein Standardverzeichnis zum Schreiben der Lizenzdatei und des Abrechnungsprotokolls zur Laufzeit. Die Standardverzeichnisse lauten /license bzw. /output.

Wenn Sie diese Verzeichnisse mit dem Befehl docker run -v in den Container einbinden, stellen Sie sicher, dass für das Verzeichnis des lokalen Computers user:group nonroot:nonroot als Besitzer festgelegt ist, bevor Sie den Container ausführen.

Im Folgenden finden Sie einen Beispielbefehl zum Festlegen des Besitzers der Datei bzw. des Verzeichnisses.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

Verwenden des Containers

Speech-Container bieten websocketbasierte Abfrageendpunkt-APIs, auf die über das Speech SDK und die Speech-Befehlszeilenschnittstelle (Command Line Interface, CLI) zugegriffen wird. Standardmäßig verwenden das Speech SDK und die Speech-CLI den öffentlichen Speech-Dienst. Um den Container verwenden zu können, müssen Sie die Initialisierungsmethode ändern.

Wichtig

Wenn Sie den Speech-Dienst mit Containern verwenden, müssen Sie die Hostauthentifizierung verwenden. Wenn Sie den Schlüssel und die Region konfigurieren, werden Anforderungen an den öffentlichen Speech-Dienst gesendet. Die Ergebnisse des Speech-Diensts sind möglicherweise nicht wie erwartet. Anforderungen von nicht verbundenen Containern schlagen fehl.