Erfassungsclient mit Azure KI Services
Der Erfassungsclient ist ein Tool, das von Microsoft auf GitHub veröffentlicht wurde und mit dem Sie schnell eine für Call Center geeignete Transkriptionslösung für Azure mit einem programmierfreien Ansatz bereitstellen können.
Tipp
Sie können das Tool und die resultierende Lösung in der Produktionsumgebung verwenden, um eine große Menge von Audiodaten zu verarbeiten.
Der Erfassungsclient verwendet Azure KI Language, Azure KI Speech, Azure Storage und Azure Functions.
Erste Schritte mit dem Erfassungsclient
Zum Ausführen des Erfassungsclients sind ein Azure-Konto und eine Azure AI Services-Ressource für mehrere Diensten erforderlich.
- Azure-Abonnement – Erstellen eines kostenlosen Kontos
- Erstellen einer Azure KI Services-Ressource im Azure-Portal.
- Rufen Sie den Ressourcenschlüssel und die Region ab. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Schlüssel anzuzeigen und zu verwalten. Weitere Informationen zu Azure KI Services-Ressourcen finden Sie in diesem Schnellstart.
Features des Erfassungsclients
Der Erfassungsclient funktioniert, indem er eine serverlose Verbindung zwischen einem dedizierten Azure-Speicherkonto und benutzerdefiniertem Azure Functions herstellt, um Transkriptionsanforderungen an den Dienst zu übergeben. Die transkribierten Audiodateien werden im dedizierten Azure Storage-Container gespeichert.
Wichtig
Die Preise variieren je nach Betriebsmodus (Batch oder Echtzeit) und ausgewählter Azure-Funktions-SKU. Standardmäßig erstellt das Tool eine Azure-Premium-Funktions-SKU, um große Mengen zu verarbeiten. Weitere Informationen hierzu finden Sie in der Preisübersicht.
Intern verwendet das Tool die Speech- und Language-Dienste und folgt bewährten Methoden zur Handhabung von Hochskalierung, Wiederholungen und Failover. Das folgende Schema beschreibt die Ressourcen und Verbindungen.
Das folgende Feature des Speech-Diensts wird vom Erfassungsclient verwendet:
- Batch-Spracherkennung: Transkribiert große Mengen von Audiodateien asynchron, einschließlich Sprecherdiarisierung; wird typischerweise in Analyseszenarien nach einem Anruf verwendet. Diarisierung ist der Vorgang der Erkennung und Aufteilung von Sprechern in Monokanal-Audiodaten.
Hier sehen Sie einige Features des Sprachdiensts, die vom Erfassungsclient verwendet werden:
- Extraktion und Redaktion von personenbezogenen Informationen (Personally Identifiable Information, PII): Identifizieren, Kategorisieren und Redigieren von vertraulichen Informationen in der Transkription von Unterhaltungen.
- Stimmungsanalyse und Opinion Mining: Analyse von Transkriptionen und Zuordnung von positiver, neutraler oder negativer Stimmung auf der Äußerungs- und Unterhaltungsebene.
Neben Azure KI Services werden diese Azure-Produkte verwendet, um die Lösung zu vervollständigen:
- Azure Storage: für die Speicherung von Telefoniedaten und der von der Batch-Transkriptions-API zurückgegebenen Transkripte. Dieses Speicherkonto sollte Benachrichtigungen verwenden, insbesondere wenn neue Dateien hinzugefügt werden. Mit diesen Benachrichtigungen wird der Transkriptionsprozess ausgelöst.
- Azure Functions: zum Erstellen des SAS-URI (Shared Access Signatures) für jede Aufzeichnung und Auslösen der HTTP POST-Anforderung zum Starten einer Transkription. Darüber hinaus werden mit Azure Functions Anforderungen zum Abrufen und Löschen von Transkriptionen mit der Batch-Transkriptions-API erstellt.
Toolanpassung
Das Tool wurde erstellt, um den Kunden schnell Ergebnisse zu zeigen. Sie können das Tool an die von Ihnen bevorzugten SKUs und Einstellungen anpassen. Die SKUs können über das Azure-Portal bearbeitet werden und der Code selbst ist auf GitHub verfügbar.
Hinweis
Wir empfehlen, die Ressourcen in einer eigenen Ressourcengruppe zu erstellen, um die Kosten besser nachvollziehen und nachverfolgen zu können.