Rychlý start: Vytvoření vlastního klíčového slova

Referenční dokumentace | Balíček (NuGet) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma
  • V Azure Portal vytvořte prostředek služby Speech.
  • Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.

Vytvoření klíčového slova v speech Studiu

Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet jenom v speech studiu. Vlastní klíčová slova nelze vytvářet ze sady SDK nebo pomocí volání REST.

  1. Přejděte do služby Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte k tématu Vytvoření služby Speech.

  2. Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.

  3. Zadejte Název, Popis a Jazyk pro projekt vlastních klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je v současné době omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).

    Popište projekt klíčových slov.

  4. V seznamu vyberte název projektu.

    Vyberte projekt klíčových slov.

  5. Pokud chcete vytvořit vlastní klíčové slovo pro svého virtuálního asistenta, vyberte Vytvořit nový model.

  6. Zadejte Název modelu, Popis a Klíčové slovo podle svého výběru a pak vyberte Další. Projděte si pokyny pro výběr efektivního klíčového slova.

    Zadejte klíčové slovo.

  7. Portál vytvoří kandidátské výslovnosti pro klíčové slovo. Naslouchejte jednotlivým kandidátům tak, že vyberete tlačítka pro přehrávání a odeberete kontroly vedle všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.

    Snímek obrazovky, který ukazuje, kde zvolíte správnou výslovnost

  8. Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .

  9. Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní z Zpracování na Úspěšné .

    Zkontrolujte klíčové slovo.

  10. V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete se .table sadou SDK, proto si nezapomeňte poznamenat jeho cestu.

    Stáhněte si tabulku modelu.

Použití modelu klíčových slov se sadou Speech SDK

Nejprve načtěte soubor modelu klíčových slov pomocí FromFile() statické funkce, která vrátí KeywordRecognitionModel. Použijte cestu k souboru, který .table jste stáhli z nástroje Speech Studio. Kromě toho vytvoříte pomocí AudioConfig výchozího mikrofonu novou instanci KeywordRecognizer pomocí konfigurace zvuku.

using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;

var keywordModel = KeywordRecognitionModel.FromFile("your/path/to/Activate_device.table");
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var keywordRecognizer = new KeywordRecognizer(audioConfig);

Dále se spuštění rozpoznávání klíčových slov provede jedním voláním RecognizeOnceAsync() předáním objektu modelu. Tím se spustí relace rozpoznávání klíčových slov, která trvá, dokud se klíčové slovo nerozpozná. Tento vzor návrhu se proto obecně používá v aplikacích s více vlákny nebo v případech, kdy můžete čekat na probuzení po neomezenou dobu.

KeywordRecognitionResult result = await keywordRecognizer.RecognizeOnceAsync(keywordModel);

Poznámka

Zde uvedený příklad používá místní rozpoznávání klíčových slov, protože nevyžaduje SpeechConfig objekt pro kontext ověřování a nekontaktuje back-end. S využitím přímého back-endového připojení ale můžete spustit jak rozpoznávání klíčových slov, tak i ověření.

Průběžné rozpoznávání

Jiné třídy v sadě Speech SDK podporují průběžné rozpoznávání (pro rozpoznávání řeči i záměru) s rozpoznáváním klíčových slov. To vám umožní použít stejný kód, který byste normálně používali pro průběžné rozpoznávání, s možností odkazovat .table na soubor pro váš model klíčových slov.

Pokud chcete nastavit průběžné rozpoznávání řeči, postupujte podle stejného vzoru návrhu, který je uvedený v průvodci rozpoznáváním řeči . Pak nahraďte voláním recognizer.StartContinuousRecognitionAsync()recognizer.StartKeywordRecognitionAsync(KeywordRecognitionModel)a předejte objekt KeywordRecognitionModel . Pokud chcete zastavit průběžné rozpoznávání pomocí rozpoznávání klíčových slov, použijte recognizer.StopKeywordRecognitionAsync() místo .recognizer.StopContinuousRecognitionAsync()

Rozpoznávání záměru používá stejný vzor jako StartKeywordRecognitionAsync funkce a StopKeywordRecognitionAsync .

Referenční dokumentace | Balíček (NuGet) | Další ukázky na GitHubu

Sada Speech SDK pro C++ podporuje rozpoznávání klíčových slov, ale zatím jsme sem nezahrnuli průvodce. Začněte tím, že vyberete jiný programovací jazyk a seznámíte se s koncepty, nebo si projděte referenční informace a ukázky jazyka C++ od začátku tohoto článku.

Referenční dokumentace | Balíček (Go) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma
  • V Azure Portal vytvořte prostředek služby Speech.
  • Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.

Nastavení prostředí

Nainstalujte sadu Speech SDK pro Go.

Rozpoznávání řeči z mikrofonu

Pomocí těchto kroků vytvořte nový modul GO.

  1. Otevřete příkazový řádek, na kterém chcete nový modul použít, a vytvořte nový soubor s názvem speech-recognition.go.

  2. Obsah nahraďte speech-recognition.go následujícím kódem.

    package main
    
    import (
    	"bufio"
    	"fmt"
    	"os"
    
    	"github.com/Microsoft/cognitive-services-speech-sdk-go/audio"
    	"github.com/Microsoft/cognitive-services-speech-sdk-go/speech"
    )
    
    func sessionStartedHandler(event speech.SessionEventArgs) {
    	defer event.Close()
    	fmt.Println("Session Started (ID=", event.SessionID, ")")
    }
    
    func sessionStoppedHandler(event speech.SessionEventArgs) {
    	defer event.Close()
    	fmt.Println("Session Stopped (ID=", event.SessionID, ")")
    }
    
    func recognizingHandler(event speech.SpeechRecognitionEventArgs) {
    	defer event.Close()
    	fmt.Println("Recognizing:", event.Result.Text)
    }
    
    func recognizedHandler(event speech.SpeechRecognitionEventArgs) {
    	defer event.Close()
    	fmt.Println("Recognized:", event.Result.Text)
    }
    
    func cancelledHandler(event speech.SpeechRecognitionCanceledEventArgs) {
    	defer event.Close()
    	fmt.Println("Received a cancellation: ", event.ErrorDetails)
    }
    
    func main() {
        subscription :=  "YourSubscriptionKey"
        region := "YourServiceRegion"
    
    	audioConfig, err := audio.NewAudioConfigFromDefaultMicrophoneInput()
    	if err != nil {
    		fmt.Println("Got an error: ", err)
    		return
    	}
    	defer audioConfig.Close()
    	speechConfig, err := speech.NewSpeechConfigFromSubscription(subscription, region)
    	if err != nil {
    		fmt.Println("Got an error: ", err)
    		return
    	}
    	defer speechConfig.Close()
    	speechRecognizer, err := speech.NewSpeechRecognizerFromConfig(speechConfig, audioConfig)
    	if err != nil {
    		fmt.Println("Got an error: ", err)
    		return
    	}
    	defer speechRecognizer.Close()
    	speechRecognizer.SessionStarted(sessionStartedHandler)
    	speechRecognizer.SessionStopped(sessionStoppedHandler)
    	speechRecognizer.Recognizing(recognizingHandler)
    	speechRecognizer.Recognized(recognizedHandler)
    	speechRecognizer.Canceled(cancelledHandler)
    	speechRecognizer.StartContinuousRecognitionAsync()
    	defer speechRecognizer.StopContinuousRecognitionAsync()
    	bufio.NewReader(os.Stdin).ReadBytes('\n')
    }
    
  3. V speech-recognition.gosouboru nahraďte YourSubscriptionKey klíčem prostředku služby Speech a nahraďte YourServiceRegion oblastí prostředku služby Speech.

Spuštěním následujících příkazů vytvořte soubor, který odkazuje go.mod na komponenty hostované na GitHubu:

go mod init speech-recognition
go get github.com/Microsoft/cognitive-services-speech-sdk-go

Teď sestavte a spusťte kód:

go build
go run speech-recognition

Vyčištění prostředků

K odebrání prostředku služby Speech, který jste vytvořili, můžete použít Azure Portal nebo rozhraní příkazového řádku (CLI) Azure.

Referenční dokumentace | Další ukázky na GitHubu

Sada Speech SDK pro Javu podporuje rozpoznávání klíčových slov, ale zatím jsme sem nezahrnuli průvodce. Začněte tím, že vyberete jiný programovací jazyk a seznámíte se s koncepty, nebo si projděte referenční informace k Javě a ukázky od začátku tohoto článku.

Referenční dokumentace | Balíček (npm) | Další ukázky na GitHubu | Zdrojový kód knihovny

Sada Speech SDK pro JavaScript nepodporuje rozpoznávání klíčových slov. Vyberte jiný programovací jazyk nebo referenční informace a ukázky JavaScriptu, na které odkazujeme od začátku tohoto článku.

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma
  • V Azure Portal vytvořte prostředek služby Speech.
  • Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.

Vytvoření klíčového slova v speech Studiu

Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet jenom v speech studiu. Vlastní klíčová slova nelze vytvářet ze sady SDK nebo pomocí volání REST.

  1. Přejděte do služby Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte k tématu Vytvoření služby Speech.

  2. Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.

  3. Zadejte Název, Popis a Jazyk pro projekt vlastních klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je v současné době omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).

    Popište projekt klíčových slov.

  4. V seznamu vyberte název projektu.

    Vyberte projekt klíčových slov.

  5. Pokud chcete vytvořit vlastní klíčové slovo pro svého virtuálního asistenta, vyberte Vytvořit nový model.

  6. Zadejte Název modelu, Popis a Klíčové slovo podle svého výběru a pak vyberte Další. Projděte si pokyny pro výběr efektivního klíčového slova.

    Zadejte klíčové slovo.

  7. Portál vytvoří kandidátské výslovnosti pro klíčové slovo. Naslouchejte jednotlivým kandidátům tak, že vyberete tlačítka pro přehrávání a odeberete kontroly vedle všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.

    Snímek obrazovky, který ukazuje, kde zvolíte správnou výslovnost

  8. Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .

  9. Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní z Zpracování na Úspěšné .

    Zkontrolujte klíčové slovo.

  10. V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete se .table sadou SDK, proto si nezapomeňte poznamenat jeho cestu.

    Stáhněte si tabulku modelu.

Použití modelu klíčových slov se sadou Speech SDK

Informace o použití vlastního modelu klíčových slov se sadou SDK Objective C najdete v ukázce na GitHubu .

Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma
  • V Azure Portal vytvořte prostředek služby Speech.
  • Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.

Vytvoření klíčového slova v speech Studiu

Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory je možné vytvářet jenom v speech studiu. Vlastní klíčová slova nelze vytvářet ze sady SDK nebo pomocí volání REST.

  1. Přejděte do služby Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte k tématu Vytvoření služby Speech.

  2. Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.

  3. Zadejte Název, Popis a Jazyk pro projekt vlastních klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je v současné době omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).

    Popište projekt klíčových slov.

  4. V seznamu vyberte název projektu.

    Vyberte projekt klíčových slov.

  5. Pokud chcete vytvořit vlastní klíčové slovo pro svého virtuálního asistenta, vyberte Vytvořit nový model.

  6. Zadejte Název modelu, Popis a Klíčové slovo podle svého výběru a pak vyberte Další. Projděte si pokyny pro výběr efektivního klíčového slova.

    Zadejte klíčové slovo.

  7. Portál vytvoří kandidátské výslovnosti pro klíčové slovo. Naslouchejte jednotlivým kandidátům tak, že vyberete tlačítka pro přehrávání a odeberete kontroly vedle všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.

    Snímek obrazovky, který ukazuje, kde zvolíte správnou výslovnost

  8. Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .

  9. Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní z Zpracování na Úspěšné .

    Zkontrolujte klíčové slovo.

  10. V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor použijete se .table sadou SDK, proto si nezapomeňte poznamenat jeho cestu.

    Stáhněte si tabulku modelu.

Použití modelu klíčových slov se sadou Speech SDK

Informace o použití vlastního modelu klíčových slov se sadou SDK Objective C najdete v ukázce na GitHubu .

Referenční dokumentace | Balíček (PyPi) | Další ukázky na GitHubu

V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma
  • V Azure Portal vytvořte prostředek služby Speech.
  • Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.

Vytvoření klíčového slova v speech Studiu

Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table soubor, který můžete použít se sadou Speech SDK.

Důležité

Vlastní modely klíčových slov a výsledné .table soubory se dají vytvořit jenom v speech studiu. Vlastní klíčová slova nemůžete vytvářet ze sady SDK nebo pomocí volání REST.

  1. Přejděte do Speech Studia a přihlaste se. Pokud předplatné služby Speech nemáte, přejděte k tématu Vytvoření služeb Speech.

  2. Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.

  3. Zadejte Název, Popis a Jazyk projektu vlastního klíčového slova. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je aktuálně omezená na angličtinu (USA) a čínštinu (mandarínština, zjednodušená).

    Popište projekt s klíčovými slovy.

  4. V seznamu vyberte název projektu.

    Vyberte projekt s klíčovými slovy.

  5. Pokud chcete pro virtuálního asistenta vytvořit vlastní klíčové slovo, vyberte Vytvořit nový model.

  6. Zadejte Název modelu, Popis a Klíčové slovo podle vašeho výběru a pak vyberte Další. Projděte si pokyny k výběru efektivního klíčového slova.

    Zadejte klíčové slovo.

  7. Portál vytvoří kandidátské výslovnosti pro vaše klíčové slovo. Poslouchejte jednotlivé kandidáty tak, že vyberete tlačítka pro přehrání a odeberete kontroly u všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.

    Snímek obrazovky, který ukazuje, kde zvolíte správnou výslovnost.

  8. Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .

  9. Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní ze Zpracování na Úspěšné .

    Zkontrolujte klíčové slovo.

  10. V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je .zip archiv. Extrahujte archiv a zobrazí se soubor s příponou .table . Soubor používáte .table se sadou SDK, proto si nezapomeňte poznamenat jeho cestu.

    Stáhněte si tabulku modelu.

Použití modelu klíčových slov se sadou Speech SDK

Podívejte se na ukázku na GitHubu pro použití modelu vlastních klíčových slov se sadou Python SDK.

Referenční informace | k rozhraní REST API pro převod řeči na textRozhraní REST API pro převod řeči na text pro krátké zvukové reference | Další ukázky na GitHubu

Rozhraní REST API pro převod řeči na text nepodporuje rozpoznávání klíčových slov. Vyberte jiný programovací jazyk nebo odkazy a ukázky odkazované na začátku tohoto článku.

Rozhraní příkazového řádku služby Speech podporuje rozpoznávání klíčových slov, ale zatím jsme sem nezahrnuli příručku. Začněte výběrem jiného programovacího jazyka a seznamte se s koncepty.

Další kroky