Dela via


Tal till text-containrar med Docker

Containern Tal till text transkriberar tal- eller batchljudinspelningar i realtid med mellanliggande resultat. I den här artikeln får du lära dig hur du laddar ned, installerar och kör en tal till text-container.

Mer information om förutsättningar, verifiering av att en container körs, körning av flera containrar på samma värd och körning av frånkopplade containrar finns i Installera och köra Speech-containrar med Docker.

Containeravbildningar

Containeravbildningen Tal till text för alla versioner och nationella inställningar som stöds finns i MCR-syndikatet (Microsoft Container Registry). Den finns på lagringsplatsen azure-cognitive-services/speechservices/ och heter speech-to-text.

En skärmbild av dialogrutan sökanslutningsappar och utlösare.

Det fullständigt kvalificerade containeravbildningsnamnet är , mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text. Lägg antingen till en viss version eller lägg till :latest för att hämta den senaste versionen.

Version Sökväg
Senast mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest

Taggen latest hämtar den senaste avbildningen en-US för nationella inställningar.
4.10.0 mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:4.10.0-amd64-mr-in

Alla taggar, förutom latest, är i följande format och är skiftlägeskänsliga:

<major>.<minor>.<patch>-<platform>-<locale>-<prerelease>

Taggarna är också tillgängliga i JSON-format för din bekvämlighet. Brödtexten innehåller containersökvägen och listan med taggar. Taggarna sorteras inte efter version, men "latest" ingår alltid i slutet av listan enligt följande kodfragment:

{
  "name": "azure-cognitive-services/speechservices/speech-to-text",
  "tags": [
    <--redacted for brevity-->    
    "4.10.0-amd64-sw-tz",
    "4.10.0-amd64-ta-in",
    "4.10.0-amd64-th-th",
    "4.10.0-amd64-tr-tr",
    "4.10.0-amd64-vi-vn",
    "4.10.0-amd64-wuu-cn",
    "4.10.0-amd64-yue-cn",
    "4.10.0-amd64-zh-cn",
    "4.10.0-amd64-zh-cn-sichuan",
    "4.10.0-amd64-zh-hk",
    "4.10.0-amd64-zh-tw",
    "4.10.0-amd64-zu-za",
    "latest"
  ]
}

Hämta containeravbildningen med docker pull

Du behöver kraven, inklusive nödvändig maskinvara. Se även den rekommenderade allokeringen av resurser för varje Speech-container.

Använd docker pull-kommandot för att ladda ned en containeravbildning från Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text:latest

Viktigt!

Taggen latest hämtar den senaste avbildningen en-US för nationella inställningar. Ytterligare versioner och nationella inställningar finns i tal till textcontaineravbildningar.

Kör containern med docker-körning

Använd kommandot docker run för att köra containern.

Följande tabell representerar de olika docker run parametrarna och deras motsvarande beskrivningar:

Parameter Description
{ENDPOINT_URI} Slutpunkten krävs för mätning och fakturering. Mer information finns i faktureringsargument.
{API_KEY} API-nyckeln krävs. Mer information finns i faktureringsargument.

När du kör tal till text-containern konfigurerar du porten, minnet och PROCESSORn enligt kraven och rekommendationerna för tal-till-text-containern.

Här är ett exempelkommando docker run med platshållarvärden. Du måste ange ENDPOINT_URI värdena och API_KEY :

docker run --rm -it -p 5000:5000 --memory 8g --cpus 4 \
mcr.microsoft.com/azure-cognitive-services/speechservices/speech-to-text \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Det här kommandot:

  • Kör en speech-to-text container från containeravbildningen.
  • Allokerar 4 CPU-kärnor och 8 GB minne.
  • Exponerar TCP-port 5000 och allokerar en pseudo-TTY för containern.
  • Tar automatiskt bort containern när den har avslutats. Containeravbildningen är fortfarande tillgänglig på värddatorn.

Mer information om docker run med Speech-containrar finns i Installera och köra Speech-containrar med Docker.

Använda containern

Talcontainrar tillhandahåller websocketbaserade frågeslutpunkts-API:er som nås via Speech SDK och Speech CLI. Som standard använder Speech SDK och Speech CLI den offentliga Speech-tjänsten. Om du vill använda containern måste du ändra initieringsmetoden.

Viktigt!

När du använder Speech-tjänsten med containrar måste du använda värdautentisering. Om du konfigurerar nyckeln och regionen går begäranden till den offentliga Speech-tjänsten. Resultat från Speech-tjänsten kanske inte är vad du förväntar dig. Begäranden från frånkopplade containrar misslyckas.

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

var config = SpeechConfig.FromSubscription(...);

Använd den här konfigurationen med containervärden:

var config = SpeechConfig.FromHost(
    new Uri("ws://localhost:5000"));

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

auto speechConfig = SpeechConfig::FromSubscription(...);

Använd den här konfigurationen med containervärden:

auto speechConfig = SpeechConfig::FromHost("ws://localhost:5000");

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

speechConfig, err := speech.NewSpeechConfigFromSubscription(...)

Använd den här konfigurationen med containervärden:

speechConfig, err := speech.NewSpeechConfigFromHost("ws://localhost:5000")

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

SpeechConfig speechConfig = SpeechConfig.fromSubscription(...);

Använd den här konfigurationen med containervärden:

SpeechConfig speechConfig = SpeechConfig.fromHost("ws://localhost:5000");

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

const speechConfig = sdk.SpeechConfig.fromSubscription(...);

Använd den här konfigurationen med containervärden:

const speechConfig = sdk.SpeechConfig.fromHost("ws://localhost:5000");

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

SPXSpeechConfiguration *speechConfig = [[SPXSpeechConfiguration alloc] initWithSubscription:...];

Använd den här konfigurationen med containervärden:

SPXSpeechConfiguration *speechConfig = [[SPXSpeechConfiguration alloc] initWithHost:"ws://localhost:5000"];

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

let speechConfig = SPXSpeechConfiguration(subscription: "", region: "");

Använd den här konfigurationen med containervärden:

let speechConfig = SPXSpeechConfiguration(host: "ws://localhost:5000");

I stället för att använda den här initieringskonfigurationen för Azure-molnet:

speech_config = speechsdk.SpeechConfig(
    subscription=speech_key, region=service_region)

Använd den här konfigurationen med containerslutpunkten:

speech_config = speechsdk.SpeechConfig(
    host="ws://localhost:5000")

När du använder Speech CLI i en container inkluderar du alternativet --host ws://localhost:5000/ . Du måste också ange --key none för att säkerställa att CLI inte försöker använda en Talnyckel för autentisering. Information om hur du konfigurerar Speech CLI finns i Kom igång med Azure AI Speech CLI.

Prova snabbstarten tal till text med värdautentisering i stället för nyckel och region.

Nästa steg