Udostępnij za pośrednictwem


Skalowalność i wydajność

Ważne

Od 20 września 2023 r. nie będzie można tworzyć nowych zasobów usługi Personalizacja. Usługa Personalizacja jest wycofywana 1 października 2026 r.

Witryny internetowe i aplikacje o wysokiej wydajności i dużym natężeniu ruchu mają dwa główne czynniki do rozważenia przy użyciu usługi Personalizacja pod kątem skalowalności i wydajności:

  • Utrzymywanie małych opóźnień podczas wykonywania wywołań interfejsu API rangi
  • Upewnij się, że przepływność trenowania utrzymuje się z danymi wejściowymi zdarzeń

Personalizacja może szybko zwrócić rangę, a większość czasu trwania wywołania dedykowanego do komunikacji za pośrednictwem interfejsu API REST. Platforma Azure będzie automatycznie skalować możliwość szybkiego reagowania na żądania.

Scenariusze o małych opóźnieniach

Niektóre aplikacje wymagają małych opóźnień podczas zwracania rangi. Konieczne są małe opóźnienia:

  • Aby uniemożliwić użytkownikowi oczekiwanie na zauważalną ilość czasu przed wyświetleniem sklasyfikowanej zawartości.
  • Aby pomóc serwerowi, na którym występuje ekstremalny ruch, należy unikać wiązania ograniczonego czasu obliczeniowego i połączeń sieciowych.

Skalowalność i przepływność trenowania

Usługa Personalizacja działa przez zaktualizowanie modelu, który jest ponownie trenowany na podstawie komunikatów wysyłanych asynchronicznie przez usługę Personalizacja po interfejsach API rangi i nagrody. Te komunikaty są wysyłane przy użyciu usługi Azure EventHub dla aplikacji.

Jest mało prawdopodobne, że większość aplikacji osiągnie maksymalną przepływność dołączania i trenowania usługi Personalizacja. Chociaż osiągnięcie tej maksymalnej wartości nie spowolni aplikacji, oznaczałoby to, że kolejki centrum zdarzeń są wypełniane wewnętrznie szybciej niż można je wyczyścić.

Jak oszacować wymagania dotyczące przepływności

  • Szacuj średnią liczbę bajtów na zdarzenie klasyfikacji, dodając długości dokumentów JSON kontekstu i akcji.
  • Podziel 20 MB/s przez te szacowane średnie bajty.

Jeśli na przykład średni ładunek ma 500 funkcji, a każdy z nich wynosi około 20 znaków, każde zdarzenie wynosi około 10 kb. Z tymi szacunkami 20 000 000 / 10 000 = 20 000 zdarzeń na sekundę, czyli około 173 milionów zdarzeń/dzień.

Jeśli osiągniesz te limity, skontaktuj się z naszym zespołem pomocy technicznej, aby uzyskać porady dotyczące architektury.

Następne kroki

Tworzenie i konfigurowanie usługi Personalizacja.