OpenAI GPT-4V (wersja zapoznawcza)

2024-09-01

Narzędzie OpenAI GPT-4V umożliwia używanie interfejsu GPT-4 interfejsu OpenAI z funkcją przetwarzania obrazów, nazywanego również GPT-4V lub gpt-4-vision-preview w interfejsie API, do tworzenia obrazów jako danych wejściowych i odpowiadania na pytania dotyczące nich.

Ważne

Narzędzie OpenAI GPT-4V jest obecnie dostępne w publicznej wersji zapoznawczej. Ta wersja zapoznawcza jest udostępniana bez umowy dotyczącej poziomu usług i nie jest zalecana w przypadku obciążeń produkcyjnych. Niektóre funkcje mogą być nieobsługiwane lub ograniczone. Aby uzyskać więcej informacji, zobacz Uzupełniające warunki korzystania z wersji zapoznawczych platformy Microsoft Azure.

Wymagania wstępne

Tworzenie zasobów openAI
- Tworzenie konta w witrynie internetowej OpenAI
- Zaloguj się i znajdź osobisty klucz interfejsu API.
Uzyskiwanie dostępu do interfejsu API GPT-4

Aby użyć interfejsu GPT-4 z funkcją przetwarzania obrazów, musisz mieć dostęp do interfejsu API GPT-4. Aby dowiedzieć się więcej, zobacz , jak uzyskać dostęp do interfejsu API GPT-4

Connection

Skonfiguruj połączenia z aprowizowaną zasobami w przepływie monitu.

Type	Nazwisko	KLUCZ API
OpenAI	Wymagania	Wymagania

Dane wejściowe

Nazwisko	Pisz	Opis	Wymagania
połączenie	OpenAI	Połączenie OpenAI, które ma być używane w narzędziu.	Tak
model	string	Model językowy do użycia obecnie obsługuje tylko bibliotekę gpt-4-vision-preview.	Tak
monit	string	Monit tekstowy używany przez model językowy do generowania odpowiedzi. Szablon Jinja do komponowania monitów w tym narzędziu jest zgodny z podobną strukturą interfejsu API czatu w narzędziu LLM. Aby przedstawić dane wejściowe obrazu w wierszu polecenia, możesz użyć składni `![image]({{INPUT NAME}})`. Dane wejściowe obrazu można przekazać w komunikatach `user`i . `system` `assistant`	Tak
max_tokens	integer	Maksymalna liczba tokenów do wygenerowania w odpowiedzi. Wartość domyślna to niska wartość wybrana przez interfejs API openAI.	Nie.
temperature	liczba zmiennoprzecinkowa	Losowość wygenerowanego tekstu. Wartość domyślna to 1.	Nie.
zatrzymać	lista	Sekwencja zatrzymywania wygenerowanego tekstu. Wartość domyślna to null.	Nie.
top_p	liczba zmiennoprzecinkowa	Prawdopodobieństwo użycia najlepszego wyboru z wygenerowanych tokenów. Wartość domyślna to 1.	Nie.
presence_penalty	liczba zmiennoprzecinkowa	Wartość, która kontroluje zachowanie modelu w odniesieniu do powtarzających się fraz. Wartość domyślna to 0.	Nie.
frequency_penalty	liczba zmiennoprzecinkowa	Wartość, która kontroluje zachowanie modelu w zakresie generowania rzadkich fraz. Wartość domyślna to 0.	Nie.

Dane wyjściowe

Zwracany typ	opis
string	Tekst jednej odpowiedzi konwersacji

Następny krok

Dowiedz się więcej na temat przetwarzania obrazów w przepływie monitów.