Rychlý start: Vytvoření vlastního klíčového slova
Referenční dokumentace | Balíček (NuGet) | Další ukázky na GitHubu
V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma
- V Azure Portal vytvořte prostředek služby Speech.
- Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.
Vytvoření klíčového slova v speech Studiu
Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table
soubor, který můžete použít se sadou Speech SDK.
Důležité
Vlastní modely klíčových slov a výsledné .table
soubory je možné vytvářet jenom v speech studiu.
Vlastní klíčová slova nelze vytvářet ze sady SDK nebo pomocí volání REST.
Přejděte do služby Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte k tématu Vytvoření služby Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte Název, Popis a Jazyk pro projekt vlastních klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je v současné době omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro svého virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte Název modelu, Popis a Klíčové slovo podle svého výběru a pak vyberte Další. Projděte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří kandidátské výslovnosti pro klíčové slovo. Naslouchejte jednotlivým kandidátům tak, že vyberete tlačítka pro přehrávání a odeberete kontroly vedle všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .
Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní z Zpracování na Úspěšné .
V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je
.zip
archiv. Extrahujte archiv a zobrazí se soubor s příponou.table
. Soubor použijete se.table
sadou SDK, proto si nezapomeňte poznamenat jeho cestu.
Použití modelu klíčových slov se sadou Speech SDK
Nejprve načtěte soubor modelu klíčových slov pomocí FromFile()
statické funkce, která vrátí KeywordRecognitionModel
. Použijte cestu k souboru, který .table
jste stáhli z nástroje Speech Studio. Kromě toho vytvoříte pomocí AudioConfig
výchozího mikrofonu novou instanci KeywordRecognizer
pomocí konfigurace zvuku.
using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;
var keywordModel = KeywordRecognitionModel.FromFile("your/path/to/Activate_device.table");
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var keywordRecognizer = new KeywordRecognizer(audioConfig);
Dále se spuštění rozpoznávání klíčových slov provede jedním voláním RecognizeOnceAsync()
předáním objektu modelu. Tím se spustí relace rozpoznávání klíčových slov, která trvá, dokud se klíčové slovo nerozpozná. Tento vzor návrhu se proto obecně používá v aplikacích s více vlákny nebo v případech, kdy můžete čekat na probuzení po neomezenou dobu.
KeywordRecognitionResult result = await keywordRecognizer.RecognizeOnceAsync(keywordModel);
Poznámka
Zde uvedený příklad používá místní rozpoznávání klíčových slov, protože nevyžaduje SpeechConfig
objekt pro kontext ověřování a nekontaktuje back-end. S využitím přímého back-endového připojení ale můžete spustit jak rozpoznávání klíčových slov, tak i ověření.
Průběžné rozpoznávání
Jiné třídy v sadě Speech SDK podporují průběžné rozpoznávání (pro rozpoznávání řeči i záměru) s rozpoznáváním klíčových slov. To vám umožní použít stejný kód, který byste normálně používali pro průběžné rozpoznávání, s možností odkazovat .table
na soubor pro váš model klíčových slov.
Pokud chcete nastavit průběžné rozpoznávání řeči, postupujte podle stejného vzoru návrhu, který je uvedený v průvodci rozpoznáváním řeči . Pak nahraďte voláním recognizer.StartContinuousRecognitionAsync()
recognizer.StartKeywordRecognitionAsync(KeywordRecognitionModel)
a předejte objekt KeywordRecognitionModel
. Pokud chcete zastavit průběžné rozpoznávání pomocí rozpoznávání klíčových slov, použijte recognizer.StopKeywordRecognitionAsync()
místo .recognizer.StopContinuousRecognitionAsync()
Rozpoznávání záměru používá stejný vzor jako StartKeywordRecognitionAsync
funkce a StopKeywordRecognitionAsync
.
Referenční dokumentace | Balíček (NuGet) | Další ukázky na GitHubu
Sada Speech SDK pro C++ podporuje rozpoznávání klíčových slov, ale zatím jsme sem nezahrnuli průvodce. Začněte tím, že vyberete jiný programovací jazyk a seznámíte se s koncepty, nebo si projděte referenční informace a ukázky jazyka C++ od začátku tohoto článku.
Referenční dokumentace | Balíček (Go) | Další ukázky na GitHubu
V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma
- V Azure Portal vytvořte prostředek služby Speech.
- Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.
Nastavení prostředí
Nainstalujte sadu Speech SDK pro Go.
Rozpoznávání řeči z mikrofonu
Pomocí těchto kroků vytvořte nový modul GO.
Otevřete příkazový řádek, na kterém chcete nový modul použít, a vytvořte nový soubor s názvem
speech-recognition.go
.Obsah nahraďte
speech-recognition.go
následujícím kódem.package main import ( "bufio" "fmt" "os" "github.com/Microsoft/cognitive-services-speech-sdk-go/audio" "github.com/Microsoft/cognitive-services-speech-sdk-go/speech" ) func sessionStartedHandler(event speech.SessionEventArgs) { defer event.Close() fmt.Println("Session Started (ID=", event.SessionID, ")") } func sessionStoppedHandler(event speech.SessionEventArgs) { defer event.Close() fmt.Println("Session Stopped (ID=", event.SessionID, ")") } func recognizingHandler(event speech.SpeechRecognitionEventArgs) { defer event.Close() fmt.Println("Recognizing:", event.Result.Text) } func recognizedHandler(event speech.SpeechRecognitionEventArgs) { defer event.Close() fmt.Println("Recognized:", event.Result.Text) } func cancelledHandler(event speech.SpeechRecognitionCanceledEventArgs) { defer event.Close() fmt.Println("Received a cancellation: ", event.ErrorDetails) } func main() { subscription := "YourSubscriptionKey" region := "YourServiceRegion" audioConfig, err := audio.NewAudioConfigFromDefaultMicrophoneInput() if err != nil { fmt.Println("Got an error: ", err) return } defer audioConfig.Close() speechConfig, err := speech.NewSpeechConfigFromSubscription(subscription, region) if err != nil { fmt.Println("Got an error: ", err) return } defer speechConfig.Close() speechRecognizer, err := speech.NewSpeechRecognizerFromConfig(speechConfig, audioConfig) if err != nil { fmt.Println("Got an error: ", err) return } defer speechRecognizer.Close() speechRecognizer.SessionStarted(sessionStartedHandler) speechRecognizer.SessionStopped(sessionStoppedHandler) speechRecognizer.Recognizing(recognizingHandler) speechRecognizer.Recognized(recognizedHandler) speechRecognizer.Canceled(cancelledHandler) speechRecognizer.StartContinuousRecognitionAsync() defer speechRecognizer.StopContinuousRecognitionAsync() bufio.NewReader(os.Stdin).ReadBytes('\n') }
V
speech-recognition.go
souboru nahraďteYourSubscriptionKey
klíčem prostředku služby Speech a nahraďteYourServiceRegion
oblastí prostředku služby Speech.
Spuštěním následujících příkazů vytvořte soubor, který odkazuje go.mod
na komponenty hostované na GitHubu:
go mod init speech-recognition
go get github.com/Microsoft/cognitive-services-speech-sdk-go
Teď sestavte a spusťte kód:
go build
go run speech-recognition
Vyčištění prostředků
K odebrání prostředku služby Speech, který jste vytvořili, můžete použít Azure Portal nebo rozhraní příkazového řádku (CLI) Azure.
Referenční dokumentace | Další ukázky na GitHubu
Sada Speech SDK pro Javu podporuje rozpoznávání klíčových slov, ale zatím jsme sem nezahrnuli průvodce. Začněte tím, že vyberete jiný programovací jazyk a seznámíte se s koncepty, nebo si projděte referenční informace k Javě a ukázky od začátku tohoto článku.
Referenční dokumentace | Balíček (npm) | Další ukázky na GitHubu | Zdrojový kód knihovny
Sada Speech SDK pro JavaScript nepodporuje rozpoznávání klíčových slov. Vyberte jiný programovací jazyk nebo referenční informace a ukázky JavaScriptu, na které odkazujeme od začátku tohoto článku.
Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu
V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma
- V Azure Portal vytvořte prostředek služby Speech.
- Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.
Vytvoření klíčového slova v speech Studiu
Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table
soubor, který můžete použít se sadou Speech SDK.
Důležité
Vlastní modely klíčových slov a výsledné .table
soubory je možné vytvářet jenom v speech studiu.
Vlastní klíčová slova nelze vytvářet ze sady SDK nebo pomocí volání REST.
Přejděte do služby Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte k tématu Vytvoření služby Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte Název, Popis a Jazyk pro projekt vlastních klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je v současné době omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro svého virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte Název modelu, Popis a Klíčové slovo podle svého výběru a pak vyberte Další. Projděte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří kandidátské výslovnosti pro klíčové slovo. Naslouchejte jednotlivým kandidátům tak, že vyberete tlačítka pro přehrávání a odeberete kontroly vedle všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .
Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní z Zpracování na Úspěšné .
V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je
.zip
archiv. Extrahujte archiv a zobrazí se soubor s příponou.table
. Soubor použijete se.table
sadou SDK, proto si nezapomeňte poznamenat jeho cestu.
Použití modelu klíčových slov se sadou Speech SDK
Informace o použití vlastního modelu klíčových slov se sadou SDK Objective C najdete v ukázce na GitHubu .
Referenční dokumentace | Balíček (stáhnout) | Další ukázky na GitHubu
V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma
- V Azure Portal vytvořte prostředek služby Speech.
- Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.
Vytvoření klíčového slova v speech Studiu
Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table
soubor, který můžete použít se sadou Speech SDK.
Důležité
Vlastní modely klíčových slov a výsledné .table
soubory je možné vytvářet jenom v speech studiu.
Vlastní klíčová slova nelze vytvářet ze sady SDK nebo pomocí volání REST.
Přejděte do služby Speech Studio a přihlaste se. Pokud nemáte předplatné služby Speech, přejděte k tématu Vytvoření služby Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte Název, Popis a Jazyk pro projekt vlastních klíčových slov. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je v současné době omezená na angličtinu (USA) a čínštinu (mandarínštinu, zjednodušenou).
V seznamu vyberte název projektu.
Pokud chcete vytvořit vlastní klíčové slovo pro svého virtuálního asistenta, vyberte Vytvořit nový model.
Zadejte Název modelu, Popis a Klíčové slovo podle svého výběru a pak vyberte Další. Projděte si pokyny pro výběr efektivního klíčového slova.
Portál vytvoří kandidátské výslovnosti pro klíčové slovo. Naslouchejte jednotlivým kandidátům tak, že vyberete tlačítka pro přehrávání a odeberete kontroly vedle všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .
Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní z Zpracování na Úspěšné .
V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je
.zip
archiv. Extrahujte archiv a zobrazí se soubor s příponou.table
. Soubor použijete se.table
sadou SDK, proto si nezapomeňte poznamenat jeho cestu.
Použití modelu klíčových slov se sadou Speech SDK
Informace o použití vlastního modelu klíčových slov se sadou SDK Objective C najdete v ukázce na GitHubu .
Referenční dokumentace | Balíček (PyPi) | Další ukázky na GitHubu
V tomto rychlém startu se naučíte základy práce s vlastními klíčovými slovy. Klíčové slovo je slovo nebo krátká fráze, která umožňuje aktivaci vašeho produktu hlasem. Modely klíčových slov se vytvářejí v nástroji Speech Studio. Potom exportujte soubor modelu, který používáte se sadou Speech SDK ve svých aplikacích.
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma
- V Azure Portal vytvořte prostředek služby Speech.
- Získejte klíč prostředku a oblast. Po nasazení prostředku služby Speech vyberte Přejít k prostředku a zobrazte a spravujte klíče. Další informace o prostředcích služeb Cognitive Services najdete v tématu Získání klíčů pro váš prostředek.
Vytvoření klíčového slova v speech Studiu
Před použitím vlastního klíčového slova je potřeba vytvořit klíčové slovo pomocí stránky Vlastní klíčové slovo v nástroji Speech Studio. Po zadání klíčového slova se vytvoří .table
soubor, který můžete použít se sadou Speech SDK.
Důležité
Vlastní modely klíčových slov a výsledné .table
soubory se dají vytvořit jenom v speech studiu.
Vlastní klíčová slova nemůžete vytvářet ze sady SDK nebo pomocí volání REST.
Přejděte do Speech Studia a přihlaste se. Pokud předplatné služby Speech nemáte, přejděte k tématu Vytvoření služeb Speech.
Na stránce Vlastní klíčové slovo vyberte Vytvořit nový projekt.
Zadejte Název, Popis a Jazyk projektu vlastního klíčového slova. Pro každý projekt můžete zvolit jenom jeden jazyk a podpora je aktuálně omezená na angličtinu (USA) a čínštinu (mandarínština, zjednodušená).
V seznamu vyberte název projektu.
Pokud chcete pro virtuálního asistenta vytvořit vlastní klíčové slovo, vyberte Vytvořit nový model.
Zadejte Název modelu, Popis a Klíčové slovo podle vašeho výběru a pak vyberte Další. Projděte si pokyny k výběru efektivního klíčového slova.
Portál vytvoří kandidátské výslovnosti pro vaše klíčové slovo. Poslouchejte jednotlivé kandidáty tak, že vyberete tlačítka pro přehrání a odeberete kontroly u všech nesprávných výslovností. Vyberte všechny výslovnosti, které odpovídají tomu, jak očekáváte, že uživatelé vysloví klíčové slovo, a pak vyberte Další a začněte generovat model klíčových slov.
Vyberte typ modelu a pak vyberte Vytvořit. Seznam oblastí, které podporují typ modelu Advanced , si můžete prohlédnout v dokumentaci k podpoře oblastí rozpoznávání klíčových slov .
Vygenerování modelu může trvat až 30 minut. Po dokončení modelu se seznam klíčových slov změní ze Zpracování na Úspěšné .
V sbalitelné nabídce na levé straně vyberte Ladit a vyberte možnosti ladění a stažení modelu. Stažený soubor je
.zip
archiv. Extrahujte archiv a zobrazí se soubor s příponou.table
. Soubor používáte.table
se sadou SDK, proto si nezapomeňte poznamenat jeho cestu.
Použití modelu klíčových slov se sadou Speech SDK
Podívejte se na ukázku na GitHubu pro použití modelu vlastních klíčových slov se sadou Python SDK.
Referenční informace | k rozhraní REST API pro převod řeči na textRozhraní REST API pro převod řeči na text pro krátké zvukové reference | Další ukázky na GitHubu
Rozhraní REST API pro převod řeči na text nepodporuje rozpoznávání klíčových slov. Vyberte jiný programovací jazyk nebo odkazy a ukázky odkazované na začátku tohoto článku.
Rozhraní příkazového řádku služby Speech podporuje rozpoznávání klíčových slov, ale zatím jsme sem nezahrnuli příručku. Začněte výběrem jiného programovacího jazyka a seznamte se s koncepty.