Skalowalność i wydajność
Ważne
Od 20 września 2023 r. nie będzie można tworzyć nowych zasobów usługi Personalizacja. Usługa Personalizacja jest wycofywana 1 października 2026 r.
Witryny internetowe i aplikacje o wysokiej wydajności i dużym natężeniu ruchu mają dwa główne czynniki do rozważenia przy użyciu usługi Personalizacja pod kątem skalowalności i wydajności:
- Utrzymywanie małych opóźnień podczas wykonywania wywołań interfejsu API rangi
- Upewnij się, że przepływność trenowania utrzymuje się z danymi wejściowymi zdarzeń
Personalizacja może szybko zwrócić rangę, a większość czasu trwania wywołania dedykowanego do komunikacji za pośrednictwem interfejsu API REST. Platforma Azure będzie automatycznie skalować możliwość szybkiego reagowania na żądania.
Scenariusze o małych opóźnieniach
Niektóre aplikacje wymagają małych opóźnień podczas zwracania rangi. Konieczne są małe opóźnienia:
- Aby uniemożliwić użytkownikowi oczekiwanie na zauważalną ilość czasu przed wyświetleniem sklasyfikowanej zawartości.
- Aby pomóc serwerowi, na którym występuje ekstremalny ruch, należy unikać wiązania ograniczonego czasu obliczeniowego i połączeń sieciowych.
Skalowalność i przepływność trenowania
Usługa Personalizacja działa przez zaktualizowanie modelu, który jest ponownie trenowany na podstawie komunikatów wysyłanych asynchronicznie przez usługę Personalizacja po interfejsach API rangi i nagrody. Te komunikaty są wysyłane przy użyciu usługi Azure EventHub dla aplikacji.
Jest mało prawdopodobne, że większość aplikacji osiągnie maksymalną przepływność dołączania i trenowania usługi Personalizacja. Chociaż osiągnięcie tej maksymalnej wartości nie spowolni aplikacji, oznaczałoby to, że kolejki centrum zdarzeń są wypełniane wewnętrznie szybciej niż można je wyczyścić.
Jak oszacować wymagania dotyczące przepływności
- Szacuj średnią liczbę bajtów na zdarzenie klasyfikacji, dodając długości dokumentów JSON kontekstu i akcji.
- Podziel 20 MB/s przez te szacowane średnie bajty.
Jeśli na przykład średni ładunek ma 500 funkcji, a każdy z nich wynosi około 20 znaków, każde zdarzenie wynosi około 10 kb. Z tymi szacunkami 20 000 000 / 10 000 = 20 000 zdarzeń na sekundę, czyli około 173 milionów zdarzeń/dzień.
Jeśli osiągniesz te limity, skontaktuj się z naszym zespołem pomocy technicznej, aby uzyskać porady dotyczące architektury.
Następne kroki
Tworzenie i konfigurowanie usługi Personalizacja.