Taalidentificatiecontainers met Docker

Artikel
09/17/2024

De spraaktaalidentificatiecontainer detecteert de taal die in audiobestanden wordt gesproken. U kunt realtime spraak- of batchaudio-opnamen krijgen met tussenliggende resultaten. In dit artikel leert u hoe u een taalidentificatiecontainer downloadt, installeert en uitvoert.

Notitie

De spraaktaalidentificatiecontainer is beschikbaar in openbare preview. Containers in preview zijn nog in ontwikkeling en voldoen niet aan de stabiliteits- en ondersteuningsvereisten van Microsoft.

Voor meer informatie over vereisten, valideren dat een container wordt uitgevoerd, meerdere containers op dezelfde host uitvoeren en niet-verbonden containers uitvoeren, raadpleegt u Speech-containers installeren en uitvoeren met Docker.

Tip

Gebruik de container spraaktaalidentificatie met de spraak-naar-tekst - of aangepaste spraak-naar-tekstcontainers om de nuttigste resultaten te verkrijgen.

Containerinstallatiekopieën

De containerinstallatiekopie voor spraaktaalidentificatie voor alle ondersteunde versies en landinstellingen vindt u in het MCR-syndicat (Microsoft Container Registry). Deze bevindt zich in de azure-cognitive-services/speechservices/ opslagplaats en heeft de naam language-detection.

De volledig gekwalificeerde containerinstallatiekopieënnaam is. mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection Voeg een specifieke versie toe of voeg toe :latest om de meest recente versie op te halen.

Versie	Pad
Laatste	`mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:latest`
1.16.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:1.16.0-amd64-preview`

Alle tags, met uitzondering van latest, hebben de volgende indeling en zijn hoofdlettergevoelig:

<major>.<minor>.<patch>-<platform>-<prerelease>

De tags zijn ook beschikbaar in JSON-indeling voor uw gemak. De hoofdtekst bevat het containerpad en de lijst met tags. De tags worden niet gesorteerd op versie, maar "latest" worden altijd opgenomen aan het einde van de lijst, zoals wordt weergegeven in dit fragment:

{
  "name": "azure-cognitive-services/speechservices/language-detection",
  "tags": [
    "1.1.0-amd64-preview",
    "1.11.0-amd64-preview",
    "1.12.0-amd64-preview",
    "1.13.0-amd64-preview",
    "1.14.0-amd64-preview",
    "1.15.0-amd64-preview",
    "1.16.0-amd64-preview",
    "1.3.0-amd64-preview",
    "1.5.0-amd64-preview",
    "1.6.1-amd64-preview",
    "1.7.0-amd64-preview",
    "1.8.0-amd64-preview",
    "latest"
  ]
}

De containerinstallatiekopie ophalen met docker pull

U hebt de vereisten nodig, inclusief vereiste hardware. Zie ook de aanbevolen toewijzing van resources voor elke Speech-container.

Gebruik de opdracht docker pull om een containerinstallatiekopie te downloaden uit Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:latest

De container uitvoeren met docker-uitvoering

Gebruik de opdracht docker run om de container uit te voeren.

De volgende tabel vertegenwoordigt de verschillende docker run parameters en de bijbehorende beschrijvingen:

Parameter	Description
`{ENDPOINT_URI}`	Het eindpunt is vereist voor het meten en factureren. Zie factureringsargumenten voor meer informatie.
`{API_KEY}`	De API-sleutel is vereist. Zie factureringsargumenten voor meer informatie.

Wanneer u de container voor spraaktaalidentificatie uitvoert, configureert u de poort, het geheugen en de CPU op basis van de vereisten en aanbevelingen voor taalidentificatiecontainers.

Hier volgt een voorbeeldopdracht docker run met tijdelijke aanduidingen. U moet de ENDPOINT_URI en API_KEY waarden opgeven:

docker run --rm -it -p 5000:5003 --memory 1g --cpus 1 \
mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Met deze opdracht gebeurt het volgende:

Voert een spraaktaalidentificatiecontainer uit vanuit de containerinstallatiekopie.
Wijst 1 CPU-kern en 1 GB geheugen toe.
Maakt TCP-poort 5000 beschikbaar en wijst een pseudo-TTY toe voor de container.
Hiermee wordt de container automatisch verwijderd nadat deze is afgesloten. De containerinstallatiekopie is nog steeds beschikbaar op de hostcomputer.

Zie Speech-containers installeren en uitvoeren met Docker voor meer informatie over docker run spraakcontainers.

Uitvoeren met de spraak-naar-tekstcontainer

Als u de taalidentificatiecontainer wilt uitvoeren met de spraak-naar-tekstcontainer , kunt u deze Docker-installatiekopie gebruiken. Nadat beide containers zijn gestart, gebruikt u deze docker run opdracht om het volgende uit te voeren speech-to-text-with-languagedetection-client:

docker run --rm -v ${HOME}:/root -ti antsu/on-prem-client:latest ./speech-to-text-with-languagedetection-client ./audio/LanguageDetection_en-us.wav --host localhost --lport 5003 --sport 5000

Het verhogen van het aantal gelijktijdige aanroepen kan van invloed zijn op de betrouwbaarheid en latentie. Voor taalidentificatie raden we maximaal vier gelijktijdige aanroepen aan met 1 CPU met 1 GB geheugen. Voor hosts met 2 CPU's en 2 GB geheugen raden we maximaal zes gelijktijdige aanroepen aan.

De container gebruiken

Spraakcontainers bieden websocket-api's voor query-eindpunten die toegankelijk zijn via de Speech SDK en Speech CLI. De Speech SDK en Speech CLI maken standaard gebruik van de openbare Speech-service. Als u de container wilt gebruiken, moet u de initialisatiemethode wijzigen.

Belangrijk

Wanneer u de Speech-service met containers gebruikt, moet u hostverificatie gebruiken. Als u de sleutel en regio configureert, worden aanvragen naar de openbare Spraak-service verzonden. Resultaten van de Speech-service zijn mogelijk niet wat u verwacht. Aanvragen van niet-verbonden containers mislukken.