Kontejnery pro identifikaci jazyka pomocí Dockeru

Článek
01/23/2024

Kontejner identifikace jazyka řeči rozpozná jazyk mluvený ve zvukových souborech. Můžete získat zvukové záznamy v reálném čase nebo dávkové zvukové nahrávky s průběžnými výsledky. V tomto článku se dozvíte, jak stáhnout, nainstalovat a spustit kontejner identifikace jazyka.

Poznámka:

Kontejner pro identifikaci jazyka Speech je k dispozici ve verzi Public Preview. Kontejnery ve verzi Preview jsou stále ve vývoji a nesplňují požadavky microsoftu na stabilitu a podporu.

Další informace o požadavcích, ověření, že je kontejner spuštěný, běží více kontejnerů na stejném hostiteli a spuštěné odpojené kontejnery, najdete v tématu Instalace a spouštění kontejnerů Služby Speech pomocí Dockeru.

Tip

Pokud chcete získat nejužitečnější výsledky, použijte kontejner identifikace jazyka speech s převodem řeči na text nebo vlastní kontejnery řeči na text .

Image kontejneru

Image kontejneru identifikace jazyka Speech pro všechny podporované verze a národní prostředí najdete v syndikátu Microsoft Container Registry (MCR). Nachází se v úložišti azure-cognitive-services/speechservices/ a má název language-detection.

Plně kvalifikovaný název image kontejneru je . mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection Připojte konkrétní verzi nebo připojte :latest , abyste získali nejnovější verzi.

Verze	Cesta
Nejpozdější	`mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:latest`
1.12.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:1.12.0-amd64-preview`

Všechny značky, s výjimkou latest, jsou v následujícím formátu a rozlišují malá a velká písmena:

<major>.<minor>.<patch>-<platform>-<prerelease>

Značky jsou také k dispozici ve formátu JSON pro usnadnění. Tělo obsahuje cestu ke kontejneru a seznam značek. Značky nejsou seřazené podle verze, ale "latest" jsou vždy zahrnuty na konci seznamu, jak je znázorněno v tomto fragmentu kódu:

{
  "name": "azure-cognitive-services/speechservices/language-detection",
  "tags": [
    "1.1.0-amd64-preview",
    "1.11.0-amd64-preview",
    "1.12.0-amd64-preview",
    "1.3.0-amd64-preview",
    "1.5.0-amd64-preview",
    <--redacted for brevity-->
    "1.8.0-amd64-preview",
    "latest"
  ]
}

Získání image kontejneru pomocí docker pull

Potřebujete požadavky, včetně požadovaného hardwaru. Podívejte se také na doporučené přidělení prostředků pro každý kontejner služby Speech.

Pomocí příkazu docker pull stáhněte image kontejneru ze služby Microsoft Container Registry:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection:latest

Spuštění kontejneru pomocí dockeru run

Ke spuštění kontejneru použijte příkaz docker run.

Následující tabulka představuje různé docker run parametry a jejich odpovídající popisy:

Parametr	Popis
`{ENDPOINT_URI}`	Koncový bod se vyžaduje pro měření a fakturaci. Další informace najdete v tématu Fakturační argumenty.
`{API_KEY}`	Vyžaduje se klíč rozhraní API. Další informace najdete v tématu Fakturační argumenty.

Při spuštění kontejneru identifikace jazyka Speech nakonfigurujte port, paměť a procesor podle požadavků a doporučení pro identifikaci jazyka.

Tady je ukázkový docker run příkaz se zástupnými hodnotami. Musíte zadat ENDPOINT_URI hodnoty a API_KEY hodnoty:

docker run --rm -it -p 5000:5003 --memory 1g --cpus 1 \
mcr.microsoft.com/azure-cognitive-services/speechservices/language-detection \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Tento příkaz:

Spustí kontejner identifikace jazyka Speech z image kontejneru.
Přidělí 1 jádro procesoru a 1 GB paměti.
Zpřístupní port TCP 5000 a přidělí pro kontejner pseudo-TTY.
Po ukončení kontejneru se automaticky odebere. Image kontejneru je stále dostupná na hostitelském počítači.

Další informace o kontejnerech služby Speech najdete v docker run tématu Instalace a spouštění kontejnerů služby Speech pomocí Dockeru.

Spuštění s kontejnerem převodu řeči na text

Pokud chcete spustit kontejner identifikace jazyka s převodem řeči na textový kontejner, můžete použít tuto image Dockeru. Po spuštění obou kontejnerů použijte tento docker run příkaz ke spuštění speech-to-text-with-languagedetection-client:

docker run --rm -v ${HOME}:/root -ti antsu/on-prem-client:latest ./speech-to-text-with-languagedetection-client ./audio/LanguageDetection_en-us.wav --host localhost --lport 5003 --sport 5000

Zvýšení počtu souběžných volání může ovlivnit spolehlivost a latenci. Pro identifikaci jazyka doporučujeme maximálně čtyři souběžná volání pomocí 1 procesoru s 1 GB paměti. Pro hostitele s 2 procesory a 2 GB paměti doporučujeme maximálně šest souběžných volání.

Použití kontejneru

Kontejnery služby Speech poskytují rozhraní API koncových bodů dotazů založených na websocketu, ke kterým se přistupuje prostřednictvím sady Speech SDK a rozhraní příkazového řádku služby Speech. Sada Speech SDK a Rozhraní příkazového řádku služby Speech ve výchozím nastavení používají veřejnou službu Speech. Pokud chcete kontejner použít, musíte změnit inicializační metodu.

Důležité

Pokud používáte službu Speech s kontejnery, nezapomeňte použít ověřování hostitele. Pokud nakonfigurujete klíč a oblast, požadavky budou chodit do veřejné služby Speech. Výsledky ze služby Speech nemusí být to, co očekáváte. Požadavky z odpojených kontejnerů selžou.