Wnioskowanie wsadowe przy użyciu interfejsów API modelu foundation aprowizowanej przepływności
Ten artykuł zawiera przykładowy notes, który wykonuje wnioskowanie wsadowe w punkcie końcowym aprowizowanej przepływności przy użyciu interfejsów API modelu foundation i ai_query.
Wymagania
- Obszar roboczy w obsługiwanym regionie interfejsów API modelu foundation.
- Jedną z następujących czynności:
- Obliczenia ogólnego przeznaczenia z rozmiarem
i3.2xlarge
obliczeniowym lub większym z uruchomionym środowiskiem Databricks Runtime 15.4 ML LTS lub nowszym z co najmniej 2 procesami roboczymi. - Magazyn SQL — średni i większy.
- Obliczenia ogólnego przeznaczenia z rozmiarem
Uruchamianie wnioskowania wsadowego
Ogólnie rzecz biorąc, skonfigurowanie wnioskowania wsadowego obejmuje 2 kroki:
- Tworzenie punktu końcowego do użycia na potrzeby wnioskowania wsadowego.
- Konstruowanie żądań wsadowych i wysyłanie tych żądań do punktu końcowego wnioskowania wsadowego przy użyciu polecenia
ai_query
.
Przykładowy notes obejmuje te kroki i demonstruje wnioskowanie wsadowe przy użyciu modelu Meta Llama 3.1 70B.