Wybieranie technologii usług Azure Cognitive Services

Azure Cognitive Services to zestaw opartych na chmurze interfejsów API, których można używać w aplikacjach sztucznej inteligencji i przepływach danych. Udostępnia wstępnie wytrenowane modele, które są gotowe do użycia w aplikacjach, nie wymagając żadnych danych i bez trenowania modelu. Usługi są opracowywane przez zespół ds. sztucznej inteligencji i badań firmy Microsoft oraz udostępniają najnowsze algorytmy uczenia głębokiego. Są one używane za pośrednictwem interfejsów REST protokołu HTTP. Ponadto zestawy SDK są dostępne dla wielu typowych struktur tworzenia aplikacji.

Najważniejsze korzyści:

  • Minimalny nakład pracy programistycznej dla najnowocześniejszych usług sztucznej inteligencji. Użyj wstępnie zdefiniowanych algorytmów lub utwórz niestandardowe algorytmy na podstawie wstępnie utworzonych bibliotek.
  • Łatwa integracja z aplikacjami za pośrednictwem interfejsów REST protokołu HTTP.
  • Deweloperzy i analitycy danych na wszystkich poziomach umiejętności mogą łatwo dodawać możliwości sztucznej inteligencji do aplikacji.

Zagadnienia dotyczące:

  • Te usługi są dostępne tylko w Internecie. Łączność z Internetem jest zwykle wymagana. Wyjątkiem jest usługa Custom Vision, której wytrenowany model można wyeksportować na potrzeby przewidywania na urządzeniach i w usłudze IoT Edge.
  • Mimo że obsługiwane jest znaczne dostosowanie, dostępne usługi mogą nie odpowiadać wszystkim wymaganiom analizy predykcyjnej.

Kategorie usług Azure Cognitive Services

Na platformie Azure są dostępne dziesiątki usług Cognitive Services. Oto lista podzielona na kategorie według obsługiwanego obszaru funkcjonalnego:

Service Link do przewodnika po decyzjach opis
Język Wybieranie usługi językowej Usługi poznawcze języka to usługi, które zapewniają funkcje przetwarzania języka naturalnego (NLP) do zrozumienia i analizowania tekstu.
Mowa Wybieranie usługi rozpoznawania mowy Usługi poznawcze mowy to usługi, które zapewniają funkcje mowy, takie jak zamiana mowy na tekst, zamiana tekstu na mowę, tłumaczenie mowy i rozpoznawanie osoby mówiącej.
Wizja Wybieranie usługi przetwarzania obrazów Usługi cognitive Services przetwarzania obrazów to usługi, które zapewniają możliwości rozpoznawania obrazów i wideo.
Usługi decyzyjne

Zastosowane usługi sztucznej inteligencji
Wybieranie interfejsu API decyzyjnego lub zastosowanej usługi sztucznej inteligencji Usługi poznawcze decyzyjne to usługi, które udostępniają funkcje NLP do tworzenia zaleceń dotyczących świadomego i wydajnego podejmowania decyzji.
Azure OpenAI Service Nie dotyczy Usługa Azure OpenAI Service zapewnia dostęp interfejsu API REST do zaawansowanych modeli języka OpenAI.

Typowe przypadki użycia

Poniżej przedstawiono niektóre typowe przypadki użycia usług Azure Cognitive Services.

Przypadek użycia Kategoria
Transkrybuj mowę na czytelny tekst z możliwością wyszukiwania. Mowa
Konwertuj tekst na realistycznie brzmiącą mowę, aby tworzyć bardziej naturalne interfejsy. Mowa
Zintegruj funkcję tłumaczenia mowy w czasie rzeczywistym ze swoimi aplikacjami. Mowa
Zidentyfikuj i zweryfikuj osobę mówiącą przy użyciu cech głosowych. Mowa
Identyfikowanie często używanych terminów i terminów specyficznych dla domeny. Język
Automatycznie wykrywa tonację i opinie w tekście. Język
Destylowanie informacji do łatwych w nawigacji pytań i odpowiedzi. Język
Umożliwianie aplikacjom interakcji z użytkownikami za pomocą języka naturalnego. Język
Tłumaczenie ponad 100 języków i dialektów. Język
Identyfikowanie i analizowanie zawartości na obrazach i wideo. Obraz
Dostosuj rozpoznawanie obrazów do swoich potrzeb biznesowych. Obraz
Zidentyfikuj potencjalne problemy na wczesnym etapie. Usługi decyzyjne /Narzędzie do wykrywania anomalii
Wykrywaj potencjalnie obraźliwą lub niepożądaną zawartość. Usługi decyzyjne / Content Moderator
Twórz zaawansowane, spersonalizowane środowiska dla każdego użytkownika. Usługi decyzyjne / Personalizacja
Stosowanie zaawansowanego kodowania i modeli językowych do różnych przypadków użycia. Azure OpenAI

Kluczowe kryteria wyboru

Aby zawęzić opcje, zacznij od udzielenia odpowiedzi na następujące pytania:

  • Czy przetwarzasz coś powiązanego z językiem mówionym, czy przetwarzasz tekst, obrazy lub dokumenty?

  • Czy masz dane do trenowania modelu? Jeśli tak, rozważ użycie usług niestandardowych, które umożliwiają trenowanie ich modeli bazowych przy użyciu danych, które podajesz. Może to poprawić dokładność i wydajność.

Ten wykres blokowy może pomóc w wyborze najlepszej usługi interfejsu API dla twojego przypadku użycia.

Diagram that shows how to select a Cognitive Services API.

  • Jeśli przypadek użycia wymaga zamiany mowy na tekst, zamiany tekstu na mowę lub zamiany mowy na mowę, użyj interfejsu API rozpoznawania mowy.
  • Jeśli przypadek użycia wymaga analizy języka, oceny tekstu lub tekstu do tekstu, użyj interfejsu API języka.
  • Jeśli musisz analizować obrazy, wideo lub tekst, użyj interfejsu API przetwarzania obrazów.
  • Jeśli musisz podjąć decyzję, użyj interfejsu API podejmowania decyzji lub zastosowanych usług sztucznej inteligencji.

Wdrażanie usług

Podczas wdrażania usług Cognitive Services można wdrażać usługi niezależnie lub używać zasobu wielosługowego usług Cognitive Services. Zasób z wieloma usługami wdraża decyzje, język, mowę, wizję i zastosowane usługi sztucznej inteligencji.

  • Wdróż pojedynczą usługę, jeśli nie potrzebujesz innych usług lub chcesz zarządzać dostępem i rozliczeniami dla poszczególnych usług.
  • Wdróż zasób wielosługowy, jeśli używasz wielu usług i chcesz zarządzać dostępem i rozliczeniami dla wszystkich usług razem.

Uwaga

Kategorie zasobów w tych usługach interfejsu API często się zmieniają. Pamiętaj, aby sprawdzić najnowszą dokumentację dla nowych kategorii.

Współautorzy

Ten artykuł jest obsługiwany przez firmę Microsoft. Pierwotnie został napisany przez następujących współautorów.

Autorzy zabezpieczeń:

Inni współautorzy:

Aby wyświetlić niepubalne profile serwisu LinkedIn, zaloguj się do serwisu LinkedIn.

Następne kroki