Was ist Direct Line Speech?

Artikel
10/16/2024

Direct Line Speech ist eine robuste, End-to-End-Lösung zur Erstellung eines flexiblen, erweiterbaren Sprachassistenten. Es basiert auf dem Bot-Framework und seinem Direct Line Speech-Kanal, der für die Sprachein- und Sprachausgabeinteraktion mit Bots optimiert ist.

Sprachassistenten hören den Benutzern zu und ergreifen als Reaktion eine Aktion, wobei sie dabei häufig antworten. Sie verwenden Spracherkennung, um die Sprache des Benutzers zu transkribieren und dann auf der Grundlage des natürlichen Sprachverständnisses des Textes Maßnahmen zu ergreifen. Diese Aktion umfasst häufig die Sprachausgabe des Assistenten, die mit Hilfe der Sprachsynthese generiert wurde.

Direct Line Speech bietet ein Höchstmaß an Anpassungsmöglichkeiten und Vielseitigkeit für Sprachassistenten. Es ist für interaktive Szenarien konzipiert, die offen, natürlich oder eine Kombination aus beidem sind und Aufgabenerledigung oder die Verwendung von Befehl-und-Steuerung (Command-and-Control) bieten.

Direct Line Speech unterstützt diese Gebietsschemas: ar-eg, ar-sa, ca-es, da-dk, de-de, en-au, en-ca, en-gb, en-in, en-nz, en-us, es-es, es-mx, fi-fi, fr-ca, fr-fr, gu-in, hi-in, hu-hu, it-it, ja-jp, ko-kr, mr-in, nb-no, nl-nl, pl-pl, pt-br, pt-pt, ru-ru, sv-se, ta-in, te-in, th-th, tr-tr, zh-cn, zh-hk und zh-tw.

Erste Schritte mit Direct Line Speech

Um einen Sprach-Assistenten mit Direct Line Speech zu erstellen, erstellen Sie eine Speech-Ressource und eine Azure Bot-Ressource im Azure-Portal. Verbinden Sie dann beide mit dem Direct Line Speech-Kanal.

Konzeptionelle Darstellung des Orchestrierungsdienstflows von Direct Line Speech

Eine vollständige, schrittweise Anleitung zur Erstellung eines einfachen Sprachassistenten mit Direct Line Speech finden Sie in dem Tutorial zur Sprachaktivierung Ihres Bot mit dem Speech SDK und dem Direct Line Speech-Kanal.

Wir bieten außerdem Schnellstarts an, mit denen Sie Code ausführen und die APIs schnell erlernen können. Diese Tabelle enthält eine Liste mit Schnellstarts für Sprachassistenten, die nach Sprache und Plattform sortiert sind.

Schnellstart	Plattform	API-Referenz
C#, UWP	Windows	Durchsuchen
Java	Windows, macOS, Linux	Durchsuchen
Java	Android	Durchsuchen

Beispielcode

Beispielcode für die Erstellung eines Sprachassistenten ist auf GitHub verfügbar. Diese Beispiele decken die Clientanwendung für die Verbindung mit Ihrem Assistenten in mehreren gängigen Programmiersprachen ab.

Anpassung

Sprachassistenten, die mithilfe des Speech-Diensts erstellt wurden, können die gesamte Bandbreite der Anpassungsoptionen nutzen, die für Spracherkennung, Sprachsynthese und die Auswahl benutzerdefinierter Stichwörter zur Verfügung stehen.

Hinweis

Die Anpassungsoptionen unterscheiden sich je nach Sprache/Gebietsschema. Weitere Informationen erhalten Sie unter Unterstützte Sprachen.

Direct Line Speech und die damit verbundene Funktionalität für Sprachassistenten sind eine ideale Ergänzung zur Lösung für virtuelle Assistenten und der Unternehmensvorlage. Direct Line Speech kann zwar mit jedem kompatiblen Bot verwendet werden, diese Ressourcen bieten jedoch eine wiederverwendbare Baseline für qualitativ hochwertige Konversationsumgebungen sowie gemeinsame unterstützende Fähigkeiten und Modelle für einen schnellen Einstieg.

Freigeben über

Was ist Direct Line Speech?

Erste Schritte mit Direct Line Speech

Beispielcode

Anpassung

Nächste Schritte

Feedback

Zusätzliche Ressourcen