Instalace a spuštění kontejnerů extrakce klíčových frází

Kontejnery umožňují hostovat rozhraní API pro extrakci klíčových frází ve vlastní infrastruktuře. Pokud máte požadavky na zabezpečení nebo zásady správného řízení dat, které není možné splnit vzdáleným voláním extrakce klíčových frází, mohou být kontejnery dobrou volbou.

Poznámka

  • Bezplatný účet je omezený na 5 000 textových záznamů za měsíc a pro kontejnery jsou platné pouze cenové úrovněFree a Standard. Další informace o sazbách požadavků na transakce najdete v tématu Limity dat a služeb.

Kontejnery umožňují spouštět rozhraní API pro extrakci klíčových frází ve vašem vlastním prostředí a jsou skvělé pro vaše specifické požadavky na zabezpečení a zásady správného řízení dat. Kontejnery Extrakce klíčových frází poskytují pokročilé zpracování přirozeného jazyka u nezpracovaného textu a zahrnují tři hlavní funkce: analýzu mínění, extrakci klíčových frází a rozpoznávání jazyka.

Požadavky

  • Pokud ještě nemáte předplatné Azure, vytvořte si bezplatný účet.
  • Docker nainstalovaný na hostitelském počítači. Docker musí být nakonfigurovaný tak, aby se kontejnery mohly připojit k Azure a odesílat do Azure fakturační data.
    • Ve Windows musí být Docker také nakonfigurovaný tak, aby podporoval kontejnery Linuxu.
    • Měli byste mít základní znalosti o konceptech Dockeru.
  • A jazyka s cenovou úrovní Free (F0) nebo Standard (S).

Shromáždění požadovaných parametrů

Pro všechny kontejnery Azure AI se vyžadují tři primární parametry. Licenční podmínky pro software společnosti Microsoft musí obsahovat hodnotu přijmout. Potřebujete také identifikátor URI koncového bodu a klíč rozhraní API.

Identifikátor URI koncového bodu

Hodnota {ENDPOINT_URI} je k dispozici na stránce přehledu Azure Portal odpovídajícího prostředku služeb Azure AI. Přejděte na stránku Přehled , najeďte myší na koncový bod a zobrazí se ikona Zkopírovat do schránky . Zkopírujte koncový bod a použijte ho tam, kde je to potřeba.

Snímek obrazovky znázorňující shromáždění identifikátoru URI koncového bodu pro pozdější použití

Klíče

Hodnota {API_KEY} se použije ke spuštění kontejneru a je k dispozici na stránce klíče Azure Portal odpovídajícího prostředku služeb Azure AI. Přejděte na stránku Klíče a vyberte ikonu Zkopírovat do schránky .

Snímek obrazovky znázorňující získání jednoho ze dvou klíčů pro pozdější použití

Důležité

Tyto klíče předplatného se používají pro přístup k rozhraní API služeb Azure AI. Klíče nesdílejte. Bezpečně je ukládejte. Použijte například Azure Key Vault. Doporučujeme také tyto klíče pravidelně vygenerovat. K volání rozhraní API je nutný pouze jeden klíč. Při opětovném vygenerování prvního klíče můžete použít druhý klíč pro trvalý přístup ke službě.

Požadavky na hostitelský počítač a doporučení

Hostitelem je počítač založený na platformě x64, na kterém běží kontejner Dockeru. Může to být počítač ve vašem místním prostředí nebo hostitelská služba Dockeru v Azure, například:

Následující tabulka popisuje minimální a doporučené specifikace pro dostupné kontejnery extrakce klíčových frází. Každé jádro procesoru musí mít alespoň 2,6 gigahertzů (GHz) nebo rychlejší. Uvádí se také povolené transakce za sekundu (TPS).

Minimální specifikace hostitele Doporučené specifikace hostitele Minimální počet transakcí za sekundu Maximální počet transakcí za sekundu
Extrakce klíčových frází 1 jádro, 2 GB paměti 1 jádro, 4 GB paměti 15 30

Jádro procesoru a paměť odpovídají --cpus nastavením a --memory , které se používají jako součást docker run příkazu .

Získání image kontejneru pomocí příkazu docker pull

Image kontejneru pro extrakci klíčových frází najdete v syndikátu registru kontejneru mcr.microsoft.com . Nachází se v úložišti azure-cognitive-services/textanalytics/ a má název keyphrase. Plně kvalifikovaný název image kontejneru je mcr.microsoft.com/azure-cognitive-services/textanalytics/keyphrase.

Pokud chcete použít nejnovější verzi kontejneru, můžete použít latest značku . Úplný seznam značek najdete také v MCR.

Ke stažení image kontejneru docker pull ze služby Microsoft Container Registry použijte příkaz .

docker pull mcr.microsoft.com/azure-cognitive-services/textanalytics/keyphrase:latest

Tip

K výpisu stažených imagí kontejnerů můžete použít příkaz docker images . Následující příkaz například vypíše ID, úložiště a značku každé stažené image kontejneru formátované jako tabulka:

docker images --format "table {{.ID}}\t{{.Repository}}\t{{.Tag}}"

IMAGE ID         REPOSITORY                TAG
<image-id>       <repository-path/name>    <tag-name>

Spuštění kontejneru pomocí příkazu docker run

Jakmile je kontejner na hostitelském počítači, spusťte kontejnery pomocí příkazu docker run . Kontejner bude běžet, dokud ho nezastavíte.

Důležité

  • Příkazy Dockeru v následujících částech používají zpětné lomítko \jako znak pokračování řádku. Nahraďte nebo odeberte tuto položku na základě požadavků hostitelského operačního systému.
  • BillingKe Eulaspuštění kontejneru je potřeba zadat možnosti , a ApiKey , jinak se kontejner nespustí. Další informace najdete v tématu Fakturace.
  • Kontejnery analýzy mínění a rozpoznávání jazyka používají rozhraní API verze 3 a jsou obecně dostupné. Kontejner Extrakce klíčových frází používá rozhraní API v2 a je ve verzi Preview.

Spuštěním následujícího docker run příkazu spusťte kontejner Extrakce klíčových frází. Nahraďte následující zástupné symboly vlastními hodnotami:

Zástupný symbol Hodnota Formát nebo příklad
{API_KEY} Klíč pro prostředek Extrakce klíčových frází. Najdete ho na stránce Klíč a koncový bod vašeho prostředku na Azure Portal. xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
{ENDPOINT_URI} Koncový bod pro přístup k rozhraní API pro extrakci klíčových frází. Najdete ho na stránce Klíč a koncový bod vašeho prostředku na Azure Portal. https://<your-custom-subdomain>.cognitiveservices.azure.com
docker run --rm -it -p 5000:5000 --memory 4g --cpus 1 \
mcr.microsoft.com/azure-cognitive-services/textanalytics/keyphrase \
Eula=accept \
Billing={ENDPOINT_URI} \
ApiKey={API_KEY}

Tento příkaz:

  • Spustí kontejner extrakce klíčových frází z image kontejneru.
  • Přidělí jedno jádro procesoru a 4 gigabajty (GB) paměti.
  • Zpřístupní port TCP 5000 a přidělí kontejneru pseudo-TTY.
  • Automaticky odebere kontejner po jeho ukončení. Image kontejneru je stále k dispozici na hostitelském počítači.

Spuštění více kontejnerů na stejném hostiteli

Pokud máte v úmyslu spustit více kontejnerů s vystavenými porty, nezapomeňte každý kontejner spustit s jiným vystaveným portem. Například první kontejner spusťte na portu 5000 a druhý kontejner na portu 5001.

Tento kontejner můžete mít na hostiteli spuštěný společně s jiným kontejnerem služeb Azure AI. Můžete také mít spuštěných několik kontejnerů stejného kontejneru služeb Azure AI.

Zadání dotazu do prediktivního koncového bodu kontejneru

Kontejner poskytuje rozhraní API prediktivního koncového bodu pro dotazy založené na REST.

Pro rozhraní API kontejneru použijte hostitele http://localhost:5000.

Ověření, že je kontejner spuštěný

Existuje několik způsobů, jak ověřit, že je kontejner spuštěný. Vyhledejte externí IP adresu a vystavený port příslušného kontejneru a otevřete oblíbený webový prohlížeč. Pomocí různých adres URL požadavků, které následují, ověřte, že kontejner běží. Tady uvedené příklady adres URL požadavků jsou http://localhost:5000, ale váš konkrétní kontejner se může lišit. Ujistěte se, že se spoléháte na externí IP adresu vašeho kontejneru a vystavený port.

Adresa URL požadavku Účel
http://localhost:5000/ Kontejner poskytuje domovskou stránku.
http://localhost:5000/ready Tato adresa URL, kterou vyžaduje get, poskytuje ověření, že kontejner je připraven přijmout dotaz na model. Tento požadavek se dá použít pro sondy živosti a připravenosti Kubernetes.
http://localhost:5000/status Tato adresa URL, která je také požadována pomocí příkazu GET, ověřuje, jestli je klíč api-key použitý ke spuštění kontejneru platný, aniž by to způsobilo dotaz koncového bodu. Tento požadavek se dá použít pro sondy živosti a připravenosti Kubernetes.
http://localhost:5000/swagger V kontejneru je ke koncovým bodům a k funkci Vyzkoušet kompletní dokumentace. Pomocí této funkce můžete zadat nastavení do webového formuláře HTML a vytvořit dotaz, aniž byste museli psát kód. Po vrácení dotazu je k dispozici ukázkový příkaz CURL, který demonstruje požadované hlavičky HTTP a formát textu.

Domovská stránka kontejneru

Spuštění kontejneru odpojeného od internetu

Pokud chcete používat tento kontejner odpojený od internetu, musíte nejprve požádat o přístup vyplněním aplikace a zakoupením plánu závazku. Další informace najdete v tématu Použití kontejnerů Dockeru v odpojených prostředích .

Pokud jste schválili spuštění kontejneru odpojeného od internetu, použijte následující příklad, který ukazuje formátování docker run příkazu, který použijete, se zástupnými hodnotami. Tyto zástupné hodnoty nahraďte vlastními hodnotami.

Parametr DownloadLicense=True v docker run příkazu stáhne licenční soubor, který umožní spuštění kontejneru Dockeru, když není připojený k internetu. Obsahuje také datum vypršení platnosti, po jehož uplynutí bude licenční soubor neplatný pro spuštění kontejneru. Licenční soubor můžete použít pouze s příslušným kontejnerem, pro který jste byli schváleni. Například nemůžete použít licenční soubor pro kontejner převodu řeči na text s kontejnerem Document Intelligence.

Zástupný symbol Hodnota Formát nebo příklad
{IMAGE} Image kontejneru, kterou chcete použít. mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice
{LICENSE_MOUNT} Cesta, kam se licence stáhne a připojí. /host/license:/path/to/license/directory
{ENDPOINT_URI} Koncový bod pro ověření vaší žádosti o službu. Najdete ho na stránce Klíč a koncový bod prostředku na Azure Portal. https://<your-custom-subdomain>.cognitiveservices.azure.com
{API_KEY} Klíč pro prostředek Analýza textu. Najdete ho na stránce Klíč a koncový bod prostředku na Azure Portal. xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
{CONTAINER_LICENSE_DIRECTORY} Umístění složky licencí v místním systému souborů kontejneru /path/to/license/directory
docker run --rm -it -p 5000:5000 \ 
-v {LICENSE_MOUNT} \
{IMAGE} \
eula=accept \
billing={ENDPOINT_URI} \
apikey={API_KEY} \
DownloadLicense=True \
Mounts:License={CONTAINER_LICENSE_DIRECTORY} 

Po stažení licenčního souboru můžete kontejner spustit v odpojené prostředí. Následující příklad ukazuje formátování příkazu, který docker run použijete, se zástupnými hodnotami. Tyto zástupné hodnoty nahraďte vlastními hodnotami.

Bez ohledu na to, kde je kontejner spuštěn, musí být soubor licence připojen ke kontejneru a umístění složky licencí v místním systému souborů kontejneru musí být zadáno pomocí Mounts:License=příkazu . Musí být také zadáno výstupní připojení, aby bylo možné zapsat záznamy o využití fakturace.

Zástupný symbol Hodnota Formát nebo příklad
{IMAGE} Image kontejneru, kterou chcete použít. mcr.microsoft.com/azure-cognitive-services/form-recognizer/invoice
{MEMORY_SIZE} Odpovídající velikost paměti, která se má přidělit kontejneru. 4g
{NUMBER_CPUS} Odpovídající počet procesorů, které se mají přidělit pro váš kontejner. 4
{LICENSE_MOUNT} Cesta, kde bude licence umístěna a připojena. /host/license:/path/to/license/directory
{OUTPUT_PATH} Výstupní cesta pro protokolování záznamů o využití. /host/output:/path/to/output/directory
{CONTAINER_LICENSE_DIRECTORY} Umístění složky licencí v místním systému souborů kontejneru /path/to/license/directory
{CONTAINER_OUTPUT_DIRECTORY} Umístění výstupní složky v místním systému souborů kontejneru /path/to/output/directory
docker run --rm -it -p 5000:5000 --memory {MEMORY_SIZE} --cpus {NUMBER_CPUS} \ 
-v {LICENSE_MOUNT} \ 
-v {OUTPUT_PATH} \
{IMAGE} \
eula=accept \
Mounts:License={CONTAINER_LICENSE_DIRECTORY}
Mounts:Output={CONTAINER_OUTPUT_DIRECTORY}

Zastavení kontejneru

Pokud chcete kontejner vypnout, vyberte v prostředí příkazového řádku, ve kterém je kontejner spuštěný, ctrl+C.

Poradce při potížích

Pokud kontejner spustíte s povoleným výstupním připojením a protokolováním, vygeneruje soubory protokolů, které jsou užitečné při řešení problémů, ke kterým dochází při spouštění nebo spouštění kontejneru.

Tip

Další informace a doprovodné materiály k řešení potíží najdete v nejčastějších dotazech k kontejnerům Azure AI.

Fakturace

Kontejnery extrakce klíčových frází odesílají fakturační údaje do Azure pomocí prostředku extrakce klíčových frází ve vašem účtu Azure.

Dotazy na kontejner se účtují na cenové úrovni prostředku Azure, který se používá pro ApiKey parametr.

Kontejnery služeb Azure AI nemají licenci ke spouštění bez připojení ke koncovému bodu měření nebo fakturace. Kontejnery musíte povolit, aby neustále komunikují s fakturačními údaji s koncovým bodem fakturace. Kontejnery služeb Azure AI neodesílají do Microsoftu zákaznická data, například analyzovaný obrázek nebo text.

Připojení k Azure

Kontejner potřebuje ke spuštění hodnoty argumentu fakturace. Tyto hodnoty umožňují kontejneru připojit se ke koncovému bodu fakturace. Kontejner hlásí využití každých 10 až 15 minut. Pokud se kontejner v povoleném časovém intervalu nepřipojí k Azure, bude kontejner dál běžet, ale nebude obsluhovat dotazy, dokud se neobnoví koncový bod fakturace. Pokus o připojení se provede 10krát ve stejném časovém intervalu 10 až 15 minut. Pokud se během 10 pokusů nemůže připojit ke koncovému bodu fakturace, kontejner přestane obsluhovat požadavky. Příklad informací odesílaných do Microsoftu k fakturaci najdete v nejčastějších dotazech ke kontejneru služeb Azure AI .

Argumenty fakturace

Příkaz docker run spustí kontejner, pokud jsou všechny tři následující možnosti k dispozici s platnými hodnotami:

Možnost Popis
ApiKey Klíč rozhraní API prostředku služeb Azure AI, který se používá ke sledování fakturačních údajů.
Hodnota této možnosti musí být nastavená na klíč rozhraní API pro zřízený prostředek, který je zadaný v Billing.
Billing Koncový bod prostředku služeb Azure AI, který slouží ke sledování fakturačních údajů.
Hodnota této možnosti musí být nastavená na identifikátor URI koncového bodu zřízeného prostředku Azure.
Eula Označuje, že jste přijali licenci pro kontejner.
Hodnota této možnosti musí být nastavena tak, aby přijímala.

\

Souhrn

V tomto článku jste se seznámili s koncepty a pracovními postupy pro stahování, instalaci a spouštění kontejnerů extrakce klíčových frází. Souhrn:

  • Extrakce klíčových frází poskytuje kontejnery Linuxu pro Docker.
  • Image kontejnerů se stahují ze služby Microsoft Container Registry (MCR).
  • Image kontejneru běží v Dockeru.
  • Pomocí rozhraní REST API nebo sady SDK můžete volat operace v kontejnerech extrakce klíčových frází zadáním identifikátoru URI hostitele kontejneru.
  • Při vytváření instance kontejneru je nutné zadat fakturační údaje.

Důležité

Kontejnery Azure AI nemají licenci ke spouštění bez připojení k Azure za účelem měření. Zákazníci musí kontejnerům umožnit, aby neustále komunikují s fakturačními údaji se službou měření. Kontejnery Azure AI neodesílají zákaznická data (např. analyzovaný text) do Microsoftu.

Další kroky