Was ist Direct Line Speech?

Direct Line Speech ist eine robuste, End-to-End-Lösung zur Erstellung eines flexiblen, erweiterbaren Sprachassistenten. Es basiert auf dem Bot-Framework und seinem Direct Line Speech-Kanal, der für die Sprachein- und Sprachausgabeinteraktion mit Bots optimiert ist.

Sprachassistenten hören den Benutzern zu und ergreifen als Reaktion eine Aktion, wobei sie dabei häufig antworten. Sie verwenden Spracherkennung, um die Sprache des Benutzers zu transkribieren und dann auf der Grundlage des natürlichen Sprachverständnisses des Textes Maßnahmen zu ergreifen. Diese Aktion umfasst häufig die Sprachausgabe des Assistenten, die mit Hilfe der Sprachsynthese generiert wurde.

Direct Line Speech bietet ein Höchstmaß an Anpassungsmöglichkeiten und Vielseitigkeit für Sprachassistenten. Es ist für interaktive Szenarien konzipiert, die offen, natürlich oder eine Kombination aus beidem sind und Aufgabenerledigung oder die Verwendung von Befehl-und-Steuerung (Command-and-Control) bieten. Dieses hohe Maß an Flexibilität geht mit einer größeren Komplexität einher. Erwägen Sie benutzerdefinierte Befehle für Szenarios, die auf gut definierte Aufgaben mit Eingaben in natürlicher Sprache ausgerichtet sind.

Direct Line Speech unterstützt diese Gebietsschemas: ar-eg, ar-sa, ca-es, da-dk, de-de, en-au, en-ca, en-gb, en-in, en-nz, en-us, es-es, es-mx, fi-fi, fr-ca, fr-fr, gu-in, hi-in, hu-hu, it-it, ja-jp, ko-kr, mr-in, nb-no, nl-nl, pl-pl, pt-br, pt-pt, ru-ru, sv-se, ta-in, te-in, th-th, tr-tr, zh-cn, zh-hk und zh-tw.

Erste Schritte mit Direct Line Speech

Um einen Sprach-Assistenten mit Direct Line Speech zu erstellen, erstellen Sie eine Speech-Ressource und eine Azure Bot-Ressource im Azure-Portal. Verbinden Sie dann beide mit dem Direct Line Speech-Kanal.

Conceptual diagram of the Direct Line Speech orchestration service flow

Eine vollständige, schrittweise Anleitung zur Erstellung eines einfachen Sprachassistenten mit Direct Line Speech finden Sie in dem Tutorial zur Sprachaktivierung Ihres Bot mit dem Speech SDK und dem Direct Line Speech-Kanal.

Wir bieten außerdem Schnellstarts an, mit denen Sie Code ausführen und die APIs schnell erlernen können. Diese Tabelle enthält eine Liste mit Schnellstarts für Sprachassistenten, die nach Sprache und Plattform sortiert sind.

Schnellstart Plattform API-Referenz
C#, UWP Windows Durchsuchen
Java Windows, macOS, Linux Durchsuchen
Java Android Durchsuchen

Beispielcode

Beispielcode für die Erstellung eines Sprachassistenten ist auf GitHub verfügbar. Diese Beispiele decken die Clientanwendung für die Verbindung mit Ihrem Assistenten in mehreren gängigen Programmiersprachen ab.

Anpassung

Sprachassistenten, die mithilfe des Speech-Diensts erstellt wurden, können die gesamte Bandbreite der Anpassungsoptionen nutzen, die für Spracherkennung, Sprachsynthese und die Auswahl benutzerdefinierter Stichwörter zur Verfügung stehen.

Hinweis

Die Anpassungsoptionen unterscheiden sich je nach Sprache/Gebietsschema. Weitere Informationen erhalten Sie unter Unterstützte Sprachen.

Direct Line Speech und die damit verbundene Funktionalität für Sprachassistenten sind eine ideale Ergänzung zur Lösung für virtuelle Assistenten und der Unternehmensvorlage. Direct Line Speech kann zwar mit jedem kompatiblen Bot verwendet werden, diese Ressourcen bieten jedoch eine wiederverwendbare Baseline für qualitativ hochwertige Konversationsumgebungen sowie gemeinsame unterstützende Fähigkeiten und Modelle für einen schnellen Einstieg.

Referenz

Nächste Schritte