Szöveg–beszédtárolók a Dockerrel

Cikk
01/23/2024

A neurális szöveg beszédtárolóvá alakítja a szöveget természetes hangzású beszédgé mély neurális hálózati technológia használatával, amely természetesebb szintetizált beszédet tesz lehetővé. Ebből a cikkből megtudhatja, hogyan tölthet le, telepíthet és futtathat szöveg-beszédtárolót.

Az előfeltételekről, a tárolók futásának ellenőrzéséről, több tároló ugyanazon a gazdagépen való futtatásáról és a leválasztott tárolók futtatásáról további információt a Speech-tárolók telepítése és futtatása a Dockerrel című témakörben talál.

Tárolólemezképek

A beszédtároló lemezképének neurális szövege az összes támogatott verzióhoz és területi beállításhoz megtalálható a Microsoft Container Registry (MCR) szindikátumán. Az adattárban azure-cognitive-services/speechservices/ található, és neve neural-text-to-speech.

A teljes tárolórendszerkép neve: mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech. Egy adott verzió hozzáfűzése vagy hozzáfűzése :latest a legújabb verzió lekéréséhez.

Verzió	Elérési út
Legutóbbi	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest` A `latest` címke lekéri a területi beállításokat és `en-us-arianeural` a `en-US` hangot.
3.1.0	`mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:3.1.0-amd64-en-us-arianeural`

A címkék kivételével latestminden címke a következő formátumban van, és megkülönbözteti a kis- és nagybetűket:

<major>.<minor>.<patch>-<platform>-<voice>-<preview>

A címkék JSON formátumban is elérhetők az Ön kényelme érdekében. A törzs tartalmazza a tároló elérési útját és a címkék listáját. A címkék nem verzió szerint lesznek rendezve, de "latest" mindig a lista végén jelennek meg, ahogyan az ebben a kódrészletben látható:

{
  "name": "azure-cognitive-services/speechservices/neural-text-to-speech",
  "tags": [
    <--redacted for brevity-->
    "3.1.0-amd64-en-us-arianeural",
    "3.1.0-amd64-en-us-guyneural",
    "3.1.0-amd64-en-us-jennymultilingualneural",
    "3.1.0-amd64-en-us-jennyneural",
    "3.1.0-amd64-en-us-michelleneural",
    "3.1.0-amd64-es-es-alvaroneural",
    "3.1.0-amd64-es-es-elviraneural",
    "3.1.0-amd64-es-mx-candelaneural",
    "3.1.0-amd64-es-mx-dalianeural",
    "3.1.0-amd64-es-mx-jorgeneural",
    <--redacted for brevity-->
    "latest"
  ]
}

Fontos

2021. augusztus 31-én megszüntettük a szabványos beszédszintézisi hangokat és a szabványos szöveget a beszédtárolóba . Neurális hangokat kell használnia a neurális-szöveg-beszéd tároló 3.0-s és újabb verziójával.

2024. február 29-től kezdődően a szöveg és a neurális szöveg a Speech Container 2.19-ben és korábbi verzióiban nem támogatott. Az alkalmazás frissítésével kapcsolatos további információkért lásd : Migrálás standard hangról előre összeállított neurális hangra.

Tárolórendszerkép lekérése Docker-lekéréssel

Szüksége van az előfeltételekre, beleértve a szükséges hardvert is. Tekintse meg az egyes Speech-tárolókhoz javasolt erőforrások lefoglalását is.

A Docker lekéréses parancsával letölthet egy tárolólemezképet a Microsoft Container Registryből:

docker pull mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech:latest

Fontos

A latest címke lekéri a területi beállításokat és en-us-arianeural a en-US hangot. További területi beállításokat és hangokat a szöveg és a beszédtároló lemezképei között talál.

A tároló futtatása docker-futtatással

A tároló futtatásához használja a docker-futtatási parancsot.

Neurális szöveg beszédre
Leválasztott neurális szöveg beszédhez

Az alábbi táblázat a különböző docker run paramétereket és azok leírását jelöli:

Paraméter	Leírás
`{ENDPOINT_URI}`	A végpont szükséges a méréshez és a számlázáshoz. További információ: számlázási argumentumok.
`{API_KEY}`	Az API-kulcs megadása kötelező. További információ: számlázási argumentumok.

Amikor a szöveget a beszédtárolóba futtatja, konfigurálja a portot, a memóriát és a PROCESSZORt a szövegnek megfelelően a beszédtároló követelményeinek és javaslatainak megfelelően.

Íme egy példaparancs docker run helyőrző értékekkel. Meg kell adnia a ENDPOINT_URI következő értékeket:API_KEY

docker run --rm -it -p 5000:5000 --memory 12g --cpus 6 \
mcr.microsoft.com/azure-cognitive-services/speechservices/neural-text-to-speech \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

A parancs a következőket hajtja végre:

Neurális szöveget futtat a tárolórendszerképből a beszédtárolóba.
6 processzormagot és 12 GB memóriát foglal le.
Az 5000-s TCP-portot teszi elérhetővé, és egy pszeudo-TTY-t foglal le a tárolóhoz.
A tárolót a kilépés után automatikusan eltávolítja. A tárolólemezkép továbbra is elérhető a gazdaszámítógépen.

Ha leválasztott tárolókat szeretne futtatni (nem csatlakozik az internethez), el kell küldenie ezt a kéreleműrlapot , és meg kell várnia a jóváhagyást. A tárolók leválasztott környezetekben való használatára vonatkozó kötelezettségvállalási terv alkalmazásával és megvásárlásával kapcsolatos további információkért lásd : Tárolók használata leválasztott környezetekben az Azure AI-szolgáltatások dokumentációjában.

Ha az internetről leválasztott tároló futtatására van jóváhagyva, az alábbi példa a használandó parancs formázását docker run mutatja be helyőrző értékekkel. Cserélje le ezeket a helyőrző értékeket a saját értékeire.

A DownloadLicense=True parancs paramétere docker run letölt egy licencfájlt, amely lehetővé teszi a Docker-tároló futtatását, ha nincs internetkapcsolata. Emellett egy lejárati dátumot is tartalmaz, amely után a licencfájl érvénytelen a tároló futtatásához. Csak a megfelelő tárolóval rendelkező licencfájlt használhatja. Például nem használhat licencfájlt tárolóval speech-to-text rendelkező neural-text-to-speech tárolókhoz.

Helyőrző	Leírás
`{IMAGE}`	A használni kívánt tárolórendszerkép. Például: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{LICENSE_MOUNT}`	A licenc letöltési és csatlakoztatási útvonala. Például: `/host/license:/path/to/license/directory`
`{ENDPOINT_URI}`	A szolgáltatáskérés hitelesítésének végpontja. Az erőforrás kulcs- és végpontoldalán , az Azure Portalon található. Például: `https://<your-resource-name>.cognitiveservices.azure.com`
`{API_KEY}`	A Speech-erőforrás kulcsa. Az erőforrás kulcs- és végpontoldalán , az Azure Portalon található.
`{CONTAINER_LICENSE_DIRECTORY}`	A licencmappa helye a tároló helyi fájlrendszerében. Például: `/path/to/license/directory`

docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}

A licencfájl letöltése után a tárolót leválasztott környezetben futtathatja. Az alábbi példa a használt parancs formázását docker run mutatja be helyőrző értékekkel. Cserélje le ezeket a helyőrző értékeket a saját értékeire.

Bárhol is fut a tároló, a licencfájlt csatlakoztatni kell a tárolóhoz, és meg kell adni Mounts:License=a tároló helyi fájlrendszerében lévő licencmappa helyét. Kimeneti csatlakoztatást is meg kell adni, hogy meg lehessen írni a számlázási használati rekordokat.

Helyőrző	Érték	Formátum vagy példa
`{IMAGE}`	A használni kívánt tárolórendszerkép. Például: `mcr.microsoft.com/azure-cognitive-services/neural-text-to-speech:latest`
`{MEMORY_SIZE}`	A tárolóhoz lefoglalandó memória mérete. Például: `4g`
`{NUMBER_CPUS}`	A tárolóhoz lefoglalandó cpu-k megfelelő száma. Például: `4`
`{LICENSE_MOUNT}`	Az elérési út, ahol a licenc található és csatlakoztatva van. Például: `/host/license:/path/to/license/directory`
`{OUTPUT_PATH}`	A naplózás kimeneti elérési útja. Például: `/host/output:/path/to/output/directory` További információ: használati rekordok az Azure AI-szolgáltatások dokumentációjában.
`{CONTAINER_LICENSE_DIRECTORY}`	A licencmappa helye a tároló helyi fájlrendszerében. Például: `/path/to/license/directory`
`{CONTAINER_OUTPUT_DIRECTORY}`	A kimeneti mappa helye a tároló helyi fájlrendszerén. Például: `/path/to/output/directory`

docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

A beszédtárolók alapértelmezett könyvtárat biztosítanak a licencfájl és a számlázási napló futásidőben történő írásához. Az alapértelmezett könyvtárak a /license és a /output.

Amikor ezeket a címtárakat a paranccsal csatlakoztatja a docker run -v tárolóhoz, a tároló futtatása előtt győződjön meg arról, hogy user:group nonroot:nonroot a helyi gépkönyvtár tulajdonjoga meg van adva.

Íme egy mintaparancs a fájl/címtár tulajdonjogának beállításához.

sudo chown -R nonroot:nonroot <YOUR_LOCAL_MACHINE_PATH_1> <YOUR_LOCAL_MACHINE_PATH_2> ...

A Speech-tárolókkal kapcsolatos docker run további információkért lásd : Speech-tárolók telepítése és futtatása a Dockerrel.

A tároló használata

A Speech-tárolók websocket-alapú lekérdezésvégpont API-kat biztosítanak, amelyek a Speech SDK-n és a Speech CLI-n keresztül érhetők el. Alapértelmezés szerint a Speech SDK és a Speech CLI a nyilvános Speech szolgáltatást használja. A tároló használatához módosítania kell az inicializálási módszert.

Fontos

Ha tárolókkal használja a Speech szolgáltatást, mindenképpen használjon gazdagép-hitelesítést. Ha konfigurálja a kulcsot és a régiót, a kérések a nyilvános beszédszolgáltatáshoz kerülnek. Előfordulhat, hogy a Speech szolgáltatás eredményei nem a vártak. A leválasztott tárolókból érkező kérések sikertelenek lesznek.