Udostępnij za pośrednictwem


Klient pozyskiwania z usługami azure AI

Klient pozyskiwania to narzędzie wydane przez firmę Microsoft w usłudze GitHub, które ułatwia szybkie wdrażanie rozwiązania transkrypcji centrum obsługi telefonicznej na platformie Azure przy użyciu podejścia bez kodu.

Napiwek

Możesz użyć narzędzia i rozwiązania w środowisku produkcyjnym, aby przetworzyć dużą ilość dźwięku.

Klient pozyskiwania używa języka AI platformy Azure, usługi Azure AI Speech, usługi Azure Storage i usługi Azure Functions.

Wprowadzenie do klienta pozyskiwania

Do uruchomienia klienta pozyskiwania jest wymagane konto platformy Azure i zasób usługi Azure AI z wieloma usługami.

  • Subskrypcja platformy Azure — utwórz bezpłatnie
  • Utwórz zasób usług Azure AI w witrynie Azure Portal.
  • Pobierz klucz zasobu i region. Po wdrożeniu zasobu wybierz pozycję Przejdź do zasobu , aby wyświetlić klucze i zarządzać nimi. Aby uzyskać więcej informacji na temat zasobów usług Azure AI, zobacz ten przewodnik Szybki start.

Funkcje klienta pozyskiwania

Klient pozyskiwania działa przez połączenie dedykowanego konta usługi Azure Storage z niestandardowymi usługami Azure Functions w sposób bezserwerowy w celu przekazywania żądań transkrypcji do usługi. Transkrypcja plików audio wylądowała w dedykowanym kontenerze usługi Azure Storage.

Ważne

Ceny różnią się w zależności od trybu operacji (wsadowego i czasu rzeczywistego), a także wybranej jednostki SKU funkcji platformy Azure. Domyślnie narzędzie utworzy jednostkę SKU funkcji platformy Azure w warstwie Premium do obsługi dużych ilości. Aby uzyskać więcej informacji, odwiedź stronę Cennik .

Wewnętrznie narzędzie korzysta z usług rozpoznawania mowy i języka oraz stosuje najlepsze rozwiązania w celu obsługi skalowania w górę, ponawiania prób i pracy w trybie failover. Poniższy schemat opisuje zasoby i połączenia.

Diagram przedstawiający architekturę klienta pozyskiwania.

Następująca funkcja usługi rozpoznawania mowy jest używana przez klienta pozyskiwania:

  • Zamiana mowy wsadowej na tekst: transkrybuj duże ilości plików audio asynchronicznie, w tym diaryzacja osoby mówiącej i jest zwykle używana w scenariuszach analizy po wywołaniu. Diarization to proces rozpoznawania i oddzielania głośników w danych audio mono channel.

Poniżej przedstawiono niektóre funkcje usługi językowej, które są używane przez klienta pozyskiwania:

  • Wyodrębnianie i redagowanie informacji osobowych (PII): identyfikowanie, kategoryzowanie i redagowanie poufnych informacji w transkrypcji konwersacji.
  • Analiza tonacji i wyszukiwania opinii: analizowanie transkrypcji i kojarzenie pozytywnych, neutralnych lub negatywnych tonacji na poziomie wypowiedzi i konwersacji.

Oprócz usług azure AI te produkty platformy Azure są używane do ukończenia rozwiązania:

  • Azure Storage: służy do przechowywania danych telefonii i transkrypcji zwracanych przez interfejs API transkrypcji wsadowej. To konto magazynu powinno używać powiadomień, szczególnie w przypadku dodawania nowych plików. Te powiadomienia są używane do wyzwalania procesu transkrypcji.
  • Azure Functions: służy do tworzenia identyfikatora URI sygnatury dostępu współdzielonego (SAS) dla każdego nagrania i wyzwalania żądania HTTP POST w celu rozpoczęcia transkrypcji. Ponadto usługa Azure Functions umożliwia tworzenie żądań pobierania i usuwania transkrypcji przy użyciu interfejsu API transkrypcji usługi Batch.

Dostosowywanie narzędzi

Narzędzie jest tworzone w celu szybkiego wyświetlania wyników klientom. Narzędzie można dostosować do preferowanych jednostek SKU i konfiguracji. Jednostki SKU można edytować w witrynie Azure Portal, a sam kod jest dostępny w witrynie GitHub.

Uwaga

Zalecamy utworzenie zasobów w tej samej dedykowanej grupie zasobów, aby łatwiej zrozumieć i śledzić koszty.

Następne kroki