Planowanie kosztów usługi Azure AI usługa wyszukiwania i zarządzanie nimi

W tym artykule wyjaśniono model rozliczeń i rozliczane zdarzenia usługi Azure AI Search oraz wskazówki dotyczące zarządzania kosztami.

W pierwszym kroku szacuj koszty punktu odniesienia przy użyciu kalkulatora cen platformy Azure. Możesz również znaleźć szacowane koszty i porównania warstw na stronie Wybieranie warstwy cenowej podczas tworzenia usługi.

Platforma Azure oferuje wbudowane zarządzanie kosztami, które przecina granice usług, aby zapewnić monitorowanie kosztów inkluzywnych oraz możliwość ustawiania budżetów i definiowania alertów. Koszty uruchamiania usługi wyszukiwania różnią się w zależności od pojemności i używanych funkcji. Po utworzeniu usługi wyszukiwania zoptymalizuj pojemność, aby płacić tylko za potrzebne elementy.

Omówienie modelu rozliczeń

Usługa Azure AI Search działa w infrastrukturze platformy Azure, która nalicza koszty podczas wdrażania nowych zasobów. Ważne jest, aby zrozumieć, że mogą istnieć inne dodatkowe koszty infrastruktury, które mogą być naliczane.

Podczas tworzenia lub używania zasobów wyszukiwania opłaty są naliczane za następujące mierniki:

  • Opłata jest naliczana godzinowo na podstawie warstwy cenowej usługi wyszukiwania proporcjonalnie do godziny.

  • Opłata jest stosowana na liczbę jednostek wyszukiwania przydzielonych do usługi. Jednostki wyszukiwania to jednostki pojemności. Łączna liczba jednostek SU jest produktem replik i partycji (R x P = SU) używanych przez usługę.

Rozliczenia są oparte na pojemności (SU) i kosztach uruchamiania funkcji Premium, takich jak wzbogacanie sztucznej inteligencji, semantyczny rangą i prywatne punkty końcowe. Mierniki skojarzone z funkcjami Premium są wymienione w poniższej tabeli.

Miernik Jednostka
Wyodrębnianie obrazów (wzbogacanie sztucznej inteligencji) 1, 2 Na 1000 obrazów. Zobacz stronę z cennikiem.
Niestandardowa umiejętność wyszukiwania jednostek (wzbogacanie sztucznej inteligencji) 1 Na 1000 rekordów tekstowych. Zobacz stronę cennika
Wbudowane umiejętności (wzbogacanie sztucznej inteligencji) 1 Liczba transakcji rozliczanych według tej samej stawki, jak w przypadku wykonania zadania przez bezpośrednie wywołanie usług Azure AI. Możesz bezpłatnie przetworzyć 20 dokumentów na indeksator dziennie. Większe lub częstsze obciążenia wymagają klucza usług Azure AI z wieloma zasobami.
Rangasemantyczna 1 Liczba zapytań "queryType=semantic", rozliczanych według progresywnej stawki. Zobacz stronę z cennikiem.
Udostępniony linkprywatny 1 Rozliczana za przepustowość , o ile istnieje współużytkowany link prywatny i jest używany.

1 Dotyczy tylko wtedy, gdy używasz lub włączasz tę funkcję.

2 W konfiguracjiimageAction indeksatora jest parametrem, który wyzwala wyodrębnianie obrazów. Jeśli imageAction ustawiono wartość "none" (wartość domyślna), nie będą naliczane opłaty za wyodrębnianie obrazów. Koszty są naliczane podczas imageAction ustawiania parametru i dołączania OCR, analizy obrazów lub wyodrębniania dokumentów w zestawie umiejętności.

Nie są naliczane opłaty za liczbę pełnotekstowych lub wektorowych zapytań, odpowiedzi na zapytania lub dokumenty pozyskane, chociaż limity usług mają zastosowanie w każdej warstwie.

Ruch danych może również wiązać się z kosztami sieci. Zobacz Cennik przepustowości.

Kilka funkcji w warstwie Premium, takich jak magazyn wiedzy, sesje debugowania i pamięć podręczna wzbogacania, mają zależność od usługi Azure Storage. Mierniki usługi Azure Storage mają zastosowanie w tym przypadku, a powiązane koszty magazynowania związane z używaniem tych funkcji są uwzględniane na rachunku za usługę Azure Storage.

Klucze zarządzane przez klienta zapewniają podwójne szyfrowanie poufnej zawartości. Ta funkcja wymaga rozliczanej usługi Azure Key Vault).

Zestawy umiejętności mogą obejmować rozliczane wbudowane umiejętności, wbudowane umiejętności niezwiązane z rozliczaniem oraz umiejętności niestandardowe. Niepodpisane umiejętności narzędziowe obejmują warunkowe, kształtowanie, scalanie tekstu, podział tekstu. Nie są naliczane opłaty za korzystanie z nich. Nie ma żadnego kluczowego wymagania interfejsu API i nie ma limitu 20 dokumentów.

Niestandardowa umiejętność to funkcje, które udostępniasz. Koszt korzystania z umiejętności niestandardowych zależy całkowicie od tego, czy kod niestandardowy wywołuje inne usługi rozliczane. Nie ma żadnego kluczowego wymagania interfejsu API i nie ma limitu 20 dokumentów dotyczących umiejętności niestandardowych.

Monitorowanie kosztów

Zarządzanie kosztami jest wbudowane w infrastrukturę platformy Azure. Zapoznaj się z tematem Rozliczenia i zarządzanie kosztami , aby uzyskać więcej informacji na temat śledzenia kosztów, narzędzi i interfejsów API.

Minimalizowanie kosztów

Postępuj zgodnie z tymi wytycznymi, aby zminimalizować koszty rozwiązania azure AI Search.

  1. Jeśli to możliwe, utwórz usługę wyszukiwania [w regionie, w którym jest więcej miejsca do magazynowania na partycję](obsługiwane regiony. Jeśli używasz wielu zasobów platformy Azure w rozwiązaniu, utwórz je w tym samym regionie lub w jak najmniejszej regionie, aby zminimalizować lub wyeliminować opłaty za przepustowość.

  2. Skaluj w górę w celu wykonywania operacji intensywnie korzystających z zasobów, takich jak indeksowanie, a następnie odsuń w dół pod kątem regularnych obciążeń zapytań. Jeśli istnieją przewidywalne wzorce dla obciążeń, możesz zsynchronizować skalowanie w górę, aby zbiegać się z oczekiwanym woluminem (należy napisać kod, aby to zautomatyzować).

    Podczas szacowania kosztów rozwiązania wyszukiwania należy pamiętać, że ceny i pojemność nie są liniowe (podwojenie pojemności przekracza dwukrotnie koszt w tej samej warstwie). Ponadto w pewnym momencie przełączenie do wyższej warstwy może zapewnić lepszą i szybszą wydajność w mniej więcej tym samym punkcie cenowym. Aby uzyskać więcej informacji i przykład, zobacz Uaktualnianie do warstwy Standardowa S2.

  3. Rozważ użycie aplikacji internetowej platformy Azure dla aplikacji frontonu, aby żądania i odpowiedzi pozostawały w granicach centrum danych.

  4. Jeśli używasz wzbogacania sztucznej inteligencji, jest naliczana dodatkowa opłata za magazyn obiektów blob, ale skumulowany koszt spadnie, jeśli włączysz buforowanie wzbogacania.

Tworzenie budżetów

W celu zarządzania kosztami można utworzyć budżety oraz alerty, które automatycznie powiadamiają uczestników o anomaliach w wydatkach i o ryzyku nadmiernych wydatków. Alerty są oparte na wydatkach w porównaniu z budżetem i progami kosztów. Budżety i alerty są tworzone dla subskrypcji i grup zasobów platformy Azure, więc są one przydatne w ramach ogólnej strategii monitorowania kosztów.

Budżety można tworzyć za pomocą filtrów dla określonych zasobów lub usług na platformie Azure, jeśli chcesz, aby monitorowanie było bardziej szczegółowe. Filtry pomagają zagwarantować, że nie utworzysz przypadkowo nowych zasobów, które kosztują dodatkowe pieniądze. Aby uzyskać więcej informacji na temat opcji filtru dostępnych podczas tworzenia budżetu, zobacz Opcje grupowania i filtrowania.

Eksportowanie danych kosztów

Możesz również wyeksportować dane kosztów na konto magazynu. Jest to przydatne, gdy potrzebujesz lub inne osoby do przeprowadzenia większej analizy danych pod kątem kosztów. Na przykład zespół finansowy może analizować dane przy użyciu programu Excel lub usługi Power BI. Możesz wyeksportować koszty według dziennego, tygodniowego lub miesięcznego harmonogramu i ustawić niestandardowy zakres dat. Eksportowanie danych kosztów jest zalecanym sposobem pobierania zestawów danych kosztów.

Często zadawane pytania

Czy mogę tymczasowo zamknąć usługę wyszukiwania, aby zaoszczędzić na kosztach?

Wyszukiwanie jest uruchamiane jako usługa ciągła. Dedykowane zasoby są zawsze operacyjne, przydzielone do wyłącznego użytku przez cały okres istnienia usługi. Aby całkowicie zatrzymać rozliczenia, musisz usunąć usługę. Usuwanie usługi jest trwałe, a także usuwa skojarzone z nią dane.

Czy mogę zmienić stawkę rozliczeniową (warstwę) istniejącej usługi wyszukiwania?

Uaktualnienie w miejscu lub obniżenie poziomu nie jest obsługiwane. Zmiana warstwy usług wymaga aprowizacji nowej usługi w odpowiedniej warstwie.

Następne kroki