Get Embeddings - Get Embeddings
Zwróć wektory osadzania dla podanych monitów tekstowych.
Metoda wykonuje wywołanie interfejsu API REST do trasy /embeddings w danym punkcie końcowym.
POST https://{resource}.services.ai.azure.com/models/embeddings?api-version=2024-05-01-preview
Parametry identyfikatora URI
| Nazwa | W | Wymagane | Typ | Opis |
|---|---|---|---|---|
|
resource
|
path | True |
string |
Nazwa zasobu usługi Azure AI Services, na przykład "my-resource" |
|
api-version
|
query | True |
string minLength: 1 |
Wersja interfejsu API do użycia dla tej operacji. |
Nagłówek żądania
| Nazwa | Wymagane | Typ | Opis |
|---|---|---|---|
| extra-parameters |
Określa, co się stanie, jeśli dodatkowe parametry, niezdefiniowane przez interfejs API REST, są przekazywane w ładunku żądania JSON.
Spowoduje to ustawienie nagłówka żądania HTTP |
Treść żądania
| Nazwa | Wymagane | Typ | Opis |
|---|---|---|---|
| input | True |
string[] |
Tekst wejściowy do osadzenia, zakodowany jako ciąg lub tablica tokenów. Aby osadzić wiele danych wejściowych w jednym żądaniu, przekaż tablicę ciągów lub tablicę tablic tokenów. |
| dimensions |
integer (int32) |
Fakultatywny. Liczba wymiarów, które powinny mieć wynikowe osadzanie danych wyjściowych. Przekazywanie wartości null powoduje, że model używa wartości domyślnej. Zwraca błąd 422, jeśli model nie obsługuje wartości lub parametru. |
|
| encoding_format |
Fakultatywny. Żądany format zwróconych osadzeń. |
||
| input_type |
Fakultatywny. Typ danych wejściowych. Zwraca błąd 422, jeśli model nie obsługuje wartości lub parametru. |
||
| model |
string |
Identyfikator określonego modelu sztucznej inteligencji do użycia, jeśli w punkcie końcowym jest dostępny więcej niż jeden model. |
Odpowiedzi
| Nazwa | Typ | Opis |
|---|---|---|
| 200 OK |
Żądanie zakończyło się pomyślnie. |
|
| Other Status Codes |
Nieoczekiwana odpowiedź na błąd. Nagłówki x-ms-error-code: string |
Zabezpieczenia
api-key
Typ:
apiKey
W:
header
OAuth2Auth
Typ:
oauth2
Flow:
implicit
Adres URL autoryzacji:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Zakresy
| Nazwa | Opis |
|---|---|
| https://cognitiveservices.azure.com/.default |
Przykłady
| maximum set embeddings |
| minimum set embeddings |
maximum set embeddings
Przykładowe żądanie
POST https://{resource}.services.ai.azure.com/models/embeddings?api-version=2024-05-01-preview
{
"input": [
"This is a very good text"
],
"dimensions": 1024,
"encoding_format": "float",
"input_type": "text",
"model": "my-model-name"
}
Przykładowa odpowiedź
{
"id": "cknxthfa",
"data": [
{
"index": 0,
"object": "embedding",
"embedding": [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
]
}
],
"object": "list",
"model": "my-model-name",
"usage": {
"prompt_tokens": 15,
"total_tokens": 15
}
}
minimum set embeddings
Przykładowe żądanie
POST https://{resource}.services.ai.azure.com/models/embeddings?api-version=2024-05-01-preview
{
"input": [
"This is a very good text"
]
}
Przykładowa odpowiedź
{
"id": "cknxthfa",
"data": [
{
"index": 0,
"object": "embedding",
"embedding": [
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0,
0
]
}
],
"object": "list",
"model": "my-model-name",
"usage": {
"prompt_tokens": 15,
"total_tokens": 15
}
}
Definicje
| Nazwa | Opis |
|---|---|
|
Azure. |
Obiekt błędu. |
|
Azure. |
Odpowiedź zawierająca szczegóły błędu. |
|
Azure. |
Obiekt zawierający bardziej szczegółowe informacje o błędzie. Zgodnie z wytycznymi dotyczącymi interfejsu API REST platformy Azure — https://aka.ms/AzureRestApiGuidelines#handling-errors. |
|
Embedding |
Określa typy osadzania do wygenerowania. Skompresowane typy osadzania, takie jak |
|
Embedding |
Reprezentuje typy danych wejściowych używane do osadzania wyszukiwania. |
|
Embedding |
Reprezentacja pojedynczego porównania powiązanych elementów osadzania. |
|
Embeddings |
Informacje o konfiguracji żądania osadzania. |
|
Embeddings |
Reprezentacja danych odpowiedzi z żądania osadzania. Osadzanie mierzy pokrewność ciągów tekstowych i są często używane do wyszukiwania, klastrowania, rekomendacji i innych podobnych scenariuszy. |
|
Embeddings |
Pomiar ilości tokenów używanych w tym żądaniu i odpowiedzi. |
|
Extra |
Określa, co się stanie, jeśli dodatkowe parametry, niezdefiniowane przez interfejs API REST, są przekazywane w ładunku żądania JSON. |
Azure.Core.Foundations.Error
Obiekt błędu.
| Nazwa | Typ | Opis |
|---|---|---|
| code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
| details |
Tablica szczegółów dotyczących określonych błędów, które doprowadziły do tego zgłoszonego błędu. |
|
| innererror |
Obiekt zawierający bardziej szczegółowe informacje niż bieżący obiekt o błędzie. |
|
| message |
string |
Czytelna dla człowieka reprezentacja błędu. |
| target |
string |
Element docelowy błędu. |
Azure.Core.Foundations.ErrorResponse
Odpowiedź zawierająca szczegóły błędu.
| Nazwa | Typ | Opis |
|---|---|---|
| error |
Obiekt błędu. |
Azure.Core.Foundations.InnerError
Obiekt zawierający bardziej szczegółowe informacje o błędzie. Zgodnie z wytycznymi dotyczącymi interfejsu API REST platformy Azure — https://aka.ms/AzureRestApiGuidelines#handling-errors.
| Nazwa | Typ | Opis |
|---|---|---|
| code |
string |
Jeden z zdefiniowanych przez serwer zestaw kodów błędów. |
| innererror |
Błąd wewnętrzny. |
EmbeddingEncodingFormat
Określa typy osadzania do wygenerowania. Skompresowane typy osadzania, takie jak uint8, int8, ubinary i binary, mogą zmniejszyć koszty magazynowania bez poświęcania integralności danych. Zwraca błąd 422, jeśli model nie obsługuje wartości lub parametru. Przeczytaj dokumentację modelu, aby poznać wartości obsługiwane przez model.
| Wartość | Opis |
|---|---|
| base64 |
Pobierz reprezentację binarną osadzania zakodowaną jako ciąg Base64. Biblioteka openAI języka Python pobiera osadzanie z interfejsu API jako zakodowane dane binarne, zamiast używać pośrednich reprezentacji dziesiętnych, tak jak zwykle. |
| binary |
Pobieranie z powrotem podpisanych plików binarnych osadzania |
| float |
Uzyskiwanie pełnej precyzji osadzania |
| int8 |
Pobieranie z powrotem logowanych int8 osadzania |
| ubinary |
Pobieranie niepodpisanych osadzania binarnego |
| uint8 |
Pobieranie niepodpisanych int8 osadzania |
EmbeddingInputType
Reprezentuje typy danych wejściowych używane do osadzania wyszukiwania.
| Wartość | Opis |
|---|---|
| text |
Wskazuje, że dane wejściowe są ogólnym tekstem wejściowym. |
| query |
Wskazuje dane wejściowe reprezentuje zapytanie wyszukiwania w celu znalezienia najbardziej odpowiednich dokumentów w bazie danych wektorów. |
| document |
Wskazuje dane wejściowe reprezentuje dokument przechowywany w bazie danych wektorów. |
EmbeddingItem
Reprezentacja pojedynczego porównania powiązanych elementów osadzania.
| Nazwa | Typ | Opis |
|---|---|---|
| embedding |
number[] (float) |
Lista wartości osadzania dla monitu wejściowego. Reprezentują one pomiar zależności wektorowej dostarczonej danych wejściowych. Lub ciąg zakodowany w formacie base64 wektora osadzania. |
| index |
integer (int32) |
Indeks monitu, do którego odpowiada element EmbeddingItem. |
| object |
enum:
embedding |
Typ obiektu tego elementu osadzania. Zawsze będzie |
EmbeddingsOptions
Informacje o konfiguracji żądania osadzania.
| Nazwa | Typ | Opis |
|---|---|---|
| dimensions |
integer (int32) |
Fakultatywny. Liczba wymiarów, które powinny mieć wynikowe osadzanie danych wyjściowych. Przekazywanie wartości null powoduje, że model używa wartości domyślnej. Zwraca błąd 422, jeśli model nie obsługuje wartości lub parametru. |
| encoding_format |
Fakultatywny. Żądany format zwróconych osadzeń. |
|
| input |
string[] |
Tekst wejściowy do osadzenia, zakodowany jako ciąg lub tablica tokenów. Aby osadzić wiele danych wejściowych w jednym żądaniu, przekaż tablicę ciągów lub tablicę tablic tokenów. |
| input_type |
Fakultatywny. Typ danych wejściowych. Zwraca błąd 422, jeśli model nie obsługuje wartości lub parametru. |
|
| model |
string |
Identyfikator określonego modelu sztucznej inteligencji do użycia, jeśli w punkcie końcowym jest dostępny więcej niż jeden model. |
EmbeddingsResult
Reprezentacja danych odpowiedzi z żądania osadzania. Osadzanie mierzy pokrewność ciągów tekstowych i są często używane do wyszukiwania, klastrowania, rekomendacji i innych podobnych scenariuszy.
| Nazwa | Typ | Opis |
|---|---|---|
| data |
Osadzanie wartości dla monitów przesłanych w żądaniu. |
|
| id |
string |
Unikatowy identyfikator wyniku osadzania. |
| model |
string |
Identyfikator modelu użyty do wygenerowania tego wyniku. |
| object |
enum:
list |
Typ obiektu wyniku osadzania. Zawsze będzie |
| usage |
Liczniki użycia dla tokenów wejściowych przy użyciu interfejsu API osadzania. |
EmbeddingsUsage
Pomiar ilości tokenów używanych w tym żądaniu i odpowiedzi.
| Nazwa | Typ | Opis |
|---|---|---|
| prompt_tokens |
integer (int32) |
Liczba tokenów w żądaniu. |
| total_tokens |
integer (int32) |
Łączna liczba tokenów transakcji w tym żądaniu/odpowiedzi. Powinna być równa liczbie tokenów w żądaniu. |
ExtraParameters
Określa, co się stanie, jeśli dodatkowe parametry, niezdefiniowane przez interfejs API REST, są przekazywane w ładunku żądania JSON.
| Wartość | Opis |
|---|---|
| error |
Jeśli usługa wykryje dodatkowe parametry w ładunku żądania, wystąpi błąd. Jest to domyślna usługa. |
| drop |
Usługa zignoruje (upuść) dodatkowe parametry w ładunku żądania. Przekaże on tylko znane parametry do modelu AI zaplecza. |
| pass-through |
Usługa przekaże dodatkowe parametry do modelu AI zaplecza. |