Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Narzędzie OpenAI GPT-4V umożliwia używanie interfejsu GPT-4 interfejsu OpenAI z funkcją przetwarzania obrazów, nazywanego również GPT-4V lub gpt-4-vision-preview w interfejsie API, do tworzenia obrazów jako danych wejściowych i odpowiadania na pytania dotyczące nich.
Ważne
Narzędzie OpenAI GPT-4V jest obecnie dostępne w publicznej wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie jest zalecana w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą być nieobsługiwane lub ograniczone. Aby uzyskać więcej informacji, zobacz Uzupełniające warunki korzystania z wersji zapoznawczych platformy Microsoft Azure.
Wymagania wstępne
Tworzenie zasobów openAI
- Tworzenie konta w witrynie internetowej OpenAI
- Zaloguj się i znajdź osobisty klucz interfejsu API.
Uzyskiwanie dostępu do interfejsu API GPT-4
Aby użyć interfejsu GPT-4 z funkcją przetwarzania obrazów, musisz mieć dostęp do interfejsu API GPT-4. Aby dowiedzieć się więcej, zobacz , jak uzyskać dostęp do interfejsu API GPT-4
Connection
Skonfiguruj połączenia z aprowizowaną zasobami w przepływie monitu.
Type | Nazwisko | KLUCZ API |
---|---|---|
OpenAI | Wymagania | Wymagania |
Dane wejściowe
Nazwisko | Pisz | Opis | Wymagania |
---|---|---|---|
połączenie | OpenAI | Połączenie OpenAI, które ma być używane w narzędziu. | Tak |
model | string | Model językowy do użycia obecnie obsługuje tylko bibliotekę gpt-4-vision-preview. | Tak |
monit | string | Monit tekstowy używany przez model językowy do generowania odpowiedzi. Szablon Jinja do komponowania monitów w tym narzędziu jest zgodny z podobną strukturą interfejsu API czatu w narzędziu LLM. Aby przedstawić dane wejściowe obrazu w wierszu polecenia, możesz użyć składni  . Dane wejściowe obrazu można przekazać w komunikatach user i . system assistant |
Tak |
max_tokens | integer | Maksymalna liczba tokenów do wygenerowania w odpowiedzi. Wartość domyślna to niska wartość wybrana przez interfejs API openAI. | Nie. |
temperature | liczba zmiennoprzecinkowa | Losowość wygenerowanego tekstu. Wartość domyślna to 1. | Nie. |
zatrzymać | lista | Sekwencja zatrzymywania wygenerowanego tekstu. Wartość domyślna to null. | Nie. |
top_p | liczba zmiennoprzecinkowa | Prawdopodobieństwo użycia najlepszego wyboru z wygenerowanych tokenów. Wartość domyślna to 1. | Nie. |
presence_penalty | liczba zmiennoprzecinkowa | Wartość, która kontroluje zachowanie modelu w odniesieniu do powtarzających się fraz. Wartość domyślna to 0. | Nie. |
frequency_penalty | liczba zmiennoprzecinkowa | Wartość, która kontroluje zachowanie modelu w zakresie generowania rzadkich fraz. Wartość domyślna to 0. | Nie. |
Dane wyjściowe
Zwracany typ | opis |
---|---|
string | Tekst jednej odpowiedzi konwersacji |
Następny krok
Dowiedz się więcej na temat przetwarzania obrazów w przepływie monitów.