Externe modellen in Mosaic AI Model Service

2025-03-11

Belangrijk

In de codevoorbeelden in dit artikel wordt het gebruik van de CRUD-API voor openbare preview-implementaties van MLflow gedemonstreerd.

In dit artikel worden externe modellen in Mosaic AI Model Serving beschreven, inclusief ondersteunde modelproviders en -beperkingen.

Wat zijn externe modellen?

Belangrijk

U kunt nu de Mosaic AI Gateway configureren op modelserving-eindpunten die externe modellen dienen. AI Gateway zorgt voor governance, bewaking en productiegereedheid voor deze model-dienende eindpunten. Zie Mozaïek AI Gateway inleiding.

Externe modellen zijn externe modellen die buiten Databricks worden gehost. Met externe modellen die worden ondersteund door Model Serving, kunt u het gebruik en beheer van verschillende LLM-providers (Large Language Model), zoals OpenAI en Antropisch, binnen een organisatie stroomlijnen. U kunt ook Mosaic AI Model Serving gebruiken als een provider om aangepaste modellen te hosten, waarvoor gebruikslimieten voor deze eindpunten gelden. Als onderdeel van deze ondersteuning biedt Model Serving een interface op hoog niveau die de interactie met deze services vereenvoudigt door een geïntegreerd eindpunt te bieden voor het afhandelen van specifieke LLM-gerelateerde aanvragen.

Daarnaast biedt azure Databricks-ondersteuning voor externe modellen gecentraliseerd referentiebeheer. Door API-sleutels op één veilige locatie op te slaan, kunnen organisaties hun beveiligingspostuur verbeteren door de blootstelling van gevoelige API-sleutels in het hele systeem te minimaliseren. Het helpt ook om te voorkomen dat deze sleutels in code worden weergegeven of dat eindgebruikers sleutels veilig moeten beheren.

Zie Zelfstudie: Externe modeleindpunten maken om query's uit te voeren op OpenAI-modellen voor stapsgewijze richtlijnen voor het maken van eindpunten voor extern model en het uitvoeren van query's op ondersteunde modellen die door deze eindpunten worden geleverd met behulp van de MLflow Deployments SDK. Raadpleeg de volgende handleidingen voor instructies over het gebruik van de Bedieningsinterface en de REST API.

Eisen

API-sleutel- of verificatievelden voor de modelprovider.
Databricks-werkruimte binnen de ondersteunende regio's voor externe modellen.

modelleveranciers

Externe modellen in Model Serving zijn ontworpen ter ondersteuning van verschillende modelproviders. Een provider vertegenwoordigt de bron van de machine learning-modellen, zoals OpenAI, Antropisch, enzovoort. Elke provider heeft de specifieke kenmerken en configuraties die zijn ingekapseld binnen het veld van de configuratie van het external_modelexterne modeleindpunt.

De volgende providers worden ondersteund:

openai: Voor modellen die worden aangeboden door OpenAI en de Azure-integraties voor Azure OpenAI en Azure OpenAI met AAD.
antropisch: Voor modellen die worden aangeboden door Antropisch.
cohere: Voor modellen die door Cohere worden aangeboden.
amazon-bedrock: Voor modellen aangeboden door Amazon Bedrock.
google-cloud-vertex-ai: Voor modellen die worden aangeboden door Google Cloud Vertex AI.
databricks-model-serving: Voor Mosaic AI model serving-eindpunten met compatibele schema's. Zie Eindpuntconfiguratie.
aangepaste: voor alternatieve providers of modellen achter aangepaste proxy's die compatibel zijn met de OpenAI-API, maar niet rechtstreeks worden ondersteund door Databricks.

Als u ondersteuning wilt aanvragen voor een provider die hier niet wordt vermeld, gebruikt u de optie aangepaste provider of neemt u contact op met uw Databricks-accountteam.

Ondersteunde modellen

Het model dat u kiest, is rechtstreeks van invloed op de resultaten van de antwoorden die u krijgt van de API-aanroepen. Kies daarom een model dat past bij uw use-casevereisten. Voor het genereren van gespreksreacties kunt u bijvoorbeeld een chatmodel kiezen. Voor het genereren van insluitingen van tekst kunt u daarentegen een insluitmodel kiezen.

Zie ondersteunde modellen.

Gebruik modellen die worden aangeboden op de Mosaic AI Model Serving-eindpunten

Mosaic AI-modellendiensten voor eindpunten worden als provider ondersteund voor de llm/v1/completions, llm/v1/chat en llm/v1/embeddings eindpunttypen. Deze eindpunten moeten de standaardqueryparameters accepteren die als verplicht zijn gemarkeerd, terwijl andere parameters mogelijk worden genegeerd, afhankelijk van of het Mosaic AI Model Serving-eindpunt deze ondersteunt.

Zie POST /serving-endpoints/{name}/aanroepen in de API-referentie voor standaard queryparameters.

Deze eindpunten moeten antwoorden produceren in de volgende OpenAI-indeling.

Voor voltooiingstaken:

{
"id": "123", # Not Required
"model": "test_databricks_model",
"choices": [
  {
    "text": "Hello World!",
    "index": 0,
    "logprobs": null, # Not Required
    "finish_reason": "length" # Not Required
  }
],
"usage": {
  "prompt_tokens": 8,
  "total_tokens": 8
  }
}

Voor chattaken:

{
  "id": "123", # Not Required
  "model": "test_chat_model",
  "choices": [{
    "index": 0,
    "message": {
      "role": "assistant",
      "content": "\n\nHello there, how may I assist you today?",
    },
    "finish_reason": "stop"
  },
  {
    "index": 1,
    "message": {
      "role": "human",
      "content": "\n\nWhat is the weather in San Francisco?",
    },
    "finish_reason": "stop"
  }],
  "usage": {
    "prompt_tokens": 8,
    "total_tokens": 8
  }
}

Voor embeddingstaken:

{
  "data": [
    {
      "embedding": [
        1.0023064255,
        -0.009327292,
        .... # (1536 floats total for ada-002)
        -0.0028842222,
      ],
      "index": 0
    },
    {
      "embedding": [
        1.0023064255,
        -0.009327292,
        .... #(1536 floats total for ada-002)
        -0.0028842222,
      ],
      "index": 0
    }
  ],
  "model": "test_embedding_model",
  "usage": {
    "prompt_tokens": 8,
    "total_tokens": 8
  }
}

Eindpuntconfiguratie

Als u externe modellen wilt leveren en er query's op wilt uitvoeren, moet u een service-eindpunt configureren. Zie Een extern model maken voor eindpunt

Voor een extern model voor eindpunten moet u het veld external_model en de bijbehorende parameters opnemen in de sectie served_entities van de eindpuntconfiguratie. Als u meerdere externe modellen in een dienend eindpunt configureert, moet u een traffic_config waarde opgeven om het verkeersrouteringspercentage voor elk extern model te definiëren.

Het external_model veld definieert het model waarnaar dit eindpunt aanvragen doorstuurt. Wanneer u een model opgeeft, is het essentieel dat de provider het model ondersteunt dat u aanvraagt. Zo ondersteunt openai als provider modellen zoals text-embedding-ada-002, maar andere providers mogelijk niet. Als het model niet wordt ondersteund door de provider, retourneert Databricks een HTTP 4xx-fout bij het routeren van aanvragen naar dat model.

De onderstaande tabel bevat een overzicht van de external_model veldparameters. Zie POST /api/2.0/serving-endpoints voor eindpuntconfiguratieparameters.

Kenmerk	Omschrijvingen
`name`	De naam van het model dat moet worden gebruikt. Bijvoorbeeld voor `gpt-3.5-turbo` het model van `GPT-3.5-Turbo` OpenAI. Dit wordt doorgegeven als onderdeel van de aanvraagbody met de bijbehorende sleutel: `"model"`.
`provider`	Hiermee geeft u de naam van de provider voor dit model. Deze tekenreekswaarde moet overeenkomen met een ondersteunde externe modelprovider. Bijvoorbeeld voor `openai` openAI-modellen `GPT-3.5` .
`task`	De taak komt overeen met het type taalmodelinteractie dat u wenst. Ondersteunde taken zijn 'llm/v1/completions', 'llm/v1/chat', 'llm/v1/embeddings'.
`<provider>_config`	Bevat aanvullende configuratiegegevens die vereist zijn voor het model. Dit omvat het opgeven van de API-basis-URL en de API-sleutel. Zie De provider configureren voor een eindpunt. Als u `custom` provider gebruikt, geeft u deze parameter op als `custom_provider_config`.

Hier volgt een voorbeeld van het maken van een extern modeleindpunt met behulp van de create_endpoint() API. In dit voorbeeld wordt een aanvraag die naar het voltooiingseindpunt is verzonden, doorgestuurd naar het claude-2 model dat wordt geleverd door anthropic.

import mlflow.deployments

client = mlflow.deployments.get_deploy_client("databricks")

client.create_endpoint(
    name="anthropic-completions-endpoint",
    config={
        "served_entities": [
            {
                "name": "test",
                "external_model": {
                    "name": "claude-2",
                    "provider": "anthropic",
                    "task": "llm/v1/completions",
                    "anthropic_config": {
                        "anthropic_api_key": "{{secrets/my_anthropic_secret_scope/anthropic_api_key}}"
                    }
                }
            }
        ]
    }
)

De provider voor een eindpunt configureren

Wanneer u een eindpunt maakt, moet u de vereiste configuraties opgeven voor de opgegeven modelprovider. In de volgende secties vindt u een overzicht van de beschikbare configuratieparameters voor eindpunten voor elke modelprovider.

Notitie

Databricks versleutelt en slaat de opgegeven referenties veilig op voor elke modelprovider. Deze referenties worden automatisch verwijderd wanneer de bijbehorende eindpunten worden verwijderd.

OpenAI

Configuratieparameter	Beschrijving	Vereist	Standaard
`openai_api_key`	De Azure Databricks-geheime sleutelreferentie voor een OpenAI API-sleutel met behulp van de OpenAI-service. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `openai_api_key_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `openai_api_key` of `openai_api_key_plaintext`.
`openai_api_key_plaintext`	De OpenAI API-sleutel, verstrekt door de OpenAI-service, in de vorm van een platte tekststring. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `openai_api_key`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `openai_api_key` of `openai_api_key_plaintext` moet worden opgegeven.
`openai_api_type`	Een optioneel veld om het type OpenAI-API op te geven dat moet worden gebruikt.	Nee	`openai`
`openai_api_base`	De basis-URL voor de OpenAI-API.	Nee	`https://api.openai.com/v1`
`openai_api_version`	Een optioneel veld om de OpenAI API-versie op te geven.	Nee
`openai_organization`	Een optioneel veld voor het opgeven van de organisatie in OpenAI.	Nee

Cohere

Configuratieparameter	Beschrijving	Vereist
`cohere_api_key`	De referentie naar de geheime sleutel in Azure Databricks voor een Cohere API-sleutel. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `cohere_api_key_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `cohere_api_key` of `cohere_api_key_plaintext`.
`cohere_api_key_plaintext`	De Cohere-API-sleutel die als een platte-teksttekenreeks is opgegeven. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `cohere_api_key`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `cohere_api_key` of `cohere_api_key_plaintext`.
`cohere_api_base`	De basis-URL voor de Cohere-service.	Nee

Antropisch

Configuratieparameter	Beschrijving	Vereist	Standaard
`anthropic_api_key`	De Azure Databricks geheime-sleutelreferentie voor een Anthropic API-sleutel. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `anthropic_api_key_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `anthropic_api_key` of `anthropic_api_key_plaintext`.
`anthropic_api_key_plaintext`	De Antropische API-sleutel gegeven als een platte tekstreeks. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `anthropic_api_key`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `anthropic_api_key` of `anthropic_api_key_plaintext`.

Azure OpenAI

Azure OpenAI heeft verschillende functies in vergelijking met de directe OpenAI-service. Zie de vergelijkingsdocumentatie voor een overzicht.

Configuratieparameter	Beschrijving	Vereist
`openai_api_key`	De Azure Databricks-geheime sleutelreferentie voor een OpenAI API-sleutel, gebruikmakend van de Azure-service. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `openai_api_key_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `openai_api_key` of `openai_api_key_plaintext`.
`openai_api_key_plaintext`	De OpenAI API-sleutel die de Azure-service gebruikt, wordt geleverd als een platte tekststring. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `openai_api_key`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `openai_api_key` of `openai_api_key_plaintext`.
`openai_api_type`	Gebruiken `azure` voor validatie van toegangstokens.	Ja
`openai_api_base`	De basis-URL voor de Azure OpenAI API-service die wordt geleverd door Azure.	Ja
`openai_api_version`	De versie van de Azure OpenAI-service die moet worden gebruikt, opgegeven door een datum.	Ja
`openai_deployment_name`	De naam van de implementatieresource voor de Azure OpenAI-service.	Ja
`openai_organization`	Een optioneel veld voor het opgeven van de organisatie in OpenAI.	Nee

Als u Azure OpenAI gebruikt met Microsoft Entra ID, gebruikt u de volgende parameters in de eindpuntconfiguratie. Databricks geeft https://cognitiveservices.azure.com/ door als het standaardbereik voor het Microsoft Entra ID-token.

Configuratieparameter	Beschrijving	Vereist
`microsoft_entra_tenant_id`	De tenant-id voor Microsoft Entra ID-verificatie.	Ja
`microsoft_entra_client_id`	De client-id voor Microsoft Entra ID-authenticatie.	Ja
`microsoft_entra_client_secret`	De Azure Databricks-geheime sleutelreferentie voor een clientgeheim dat wordt gebruikt voor Microsoft Entra ID-verificatie. Als u uw clientgeheim liever rechtstreeks plakt, zie `microsoft_entra_client_secret_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `microsoft_entra_client_secret` of `microsoft_entra_client_secret_plaintext`.
`microsoft_entra_client_secret_plaintext`	Het clientgeheim dat wordt gebruikt voor Microsoft Entra ID-authenticatie, opgegeven als een platte teksttekenreeks. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `microsoft_entra_client_secret`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `microsoft_entra_client_secret` of `microsoft_entra_client_secret_plaintext`.
`openai_api_type`	Gebruiken `azuread` voor verificatie met behulp van Microsoft Entra-id.	Ja
`openai_api_base`	De basis-URL voor de Azure OpenAI API-service die wordt geleverd door Azure.	Ja
`openai_api_version`	De versie van de Azure OpenAI-service die moet worden gebruikt, opgegeven door een datum.	Ja
`openai_deployment_name`	De naam van de implementatieresource voor de Azure OpenAI-service.	Ja
`openai_organization`	Een optioneel veld voor het opgeven van de organisatie in OpenAI.	Nee

In het volgende voorbeeld ziet u hoe u een eindpunt maakt met Azure OpenAI:

client.create_endpoint(
    name="openai-chat-endpoint",
    config={
        "served_entities": [{
            "external_model": {
                "name": "gpt-3.5-turbo",
                "provider": "openai",
                "task": "llm/v1/chat",
                "openai_config": {
                    "openai_api_type": "azure",
                    "openai_api_key": "{{secrets/my_openai_secret_scope/openai_api_key}}",
                    "openai_api_base": "https://my-azure-openai-endpoint.openai.azure.com",
                    "openai_deployment_name": "my-gpt-35-turbo-deployment",
                    "openai_api_version": "2023-05-15"
                }
            }
        }]
    }
)

Google Cloud Vertex AI

Configuratieparameter	Beschrijving	Vereist
`private_key`	De Azure Databricks-verwijzing naar een geheime sleutel voor het serviceaccount dat toegang heeft tot de Google Cloud Vertex AI-service. Zie aanbevolen procedures voor het beheren van serviceaccountsleutels. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `private_key_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `private_key` of `private_key_plaintext`.
`private_key_plaintext`	De privésleutel voor het serviceaccount dat toegang heeft tot de Google Cloud Vertex AI-service die als een platte tekst geheim wordt verstrekt. Zie aanbevolen procedures voor het beheren van serviceaccountsleutels. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `private_key`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `private_key` of `private_key_plaintext`.
`region`	Dit is de regio voor de Google Cloud Vertex AI-service. Zie ondersteunde regio's voor meer informatie. Sommige modellen zijn alleen beschikbaar in specifieke regio's.	Ja
`project_id`	Dit is de Google Cloud-project-id waaraan het serviceaccount is gekoppeld.	Ja

Amazon Bedrock

Als u Amazon Bedrock als externe modelprovider wilt gebruiken, moeten klanten ervoor zorgen dat Bedrock is ingeschakeld in de opgegeven AWS-regio en hebben het opgegeven AWS-sleutelpaar de juiste machtigingen om te communiceren met Bedrock-services. Zie AWS Identity and Access Management voor meer informatie.

Configuratieparameter	Beschrijving	Vereist
`aws_region`	De AWS-regio die moet worden gebruikt. Bedrock moet daar ingeschakeld zijn.	Ja
`aws_access_key_id`	De referentie naar de geheime sleutel van Azure Databricks voor een AWS-toegangssleutel-ID met machtigingen om samen te werken met Bedrock-services. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `aws_access_key_id_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `aws_access_key_id` of `aws_access_key_id_plaintext`.
`aws_access_key_id_plaintext`	Een AWS-toegangssleutel-id met machtigingen voor interactie met Bedrock-services die als een platte tekst worden geleverd. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `aws_access_key_id`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `aws_access_key_id` of `aws_access_key_id_plaintext`.
`aws_secret_access_key`	De azure Databricks-geheime sleutelreferentie voor een AWS-toegangssleutel die is gekoppeld aan de toegangssleutel-id, met machtigingen voor interactie met Bedrock-services. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `aws_secret_access_key_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `aws_secret_access_key` of `aws_secret_access_key_plaintext`.
`aws_secret_access_key_plaintext`	Een AWS secret access key die is gekoppeld aan de access key ID, met machtigingen om te communiceren met Bedrock-services, geleverd als platte tekst. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `aws_secret_access_key`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `aws_secret_access_key` of `aws_secret_access_key_plaintext`.
`bedrock_provider`	De onderliggende dienstverlener in Amazon Bedrock. Ondersteunde waarden (niet hoofdlettergevoelig) zijn: Antropisch, Cohere, AI21Labs, Amazon	Ja

In het volgende voorbeeld ziet u hoe u een eindpunt maakt met Amazon Bedrock met behulp van toegangssleutels.

client.create_endpoint(
    name="bedrock-anthropic-completions-endpoint",
    config={
        "served_entities": [
            {
                "external_model": {
                    "name": "claude-v2",
                    "provider": "amazon-bedrock",
                    "task": "llm/v1/completions",
                    "amazon_bedrock_config": {
                        "aws_region": "<YOUR_AWS_REGION>",
                        "aws_access_key_id": "{{secrets/my_amazon_bedrock_secret_scope/aws_access_key_id}}",
                        "aws_secret_access_key": "{{secrets/my_amazon_bedrock_secret_scope/aws_secret_access_key}}",
                        "bedrock_provider": "anthropic",
                    },
                }
            }
        ]
    },
)

Als er problemen zijn met AWS-machtigingen, raadt Databricks u aan om de referenties rechtstreeks te verifiëren met de Amazon Bedrock-API.

AI21 Labs

Configuratieparameter	Beschrijving	Vereist	Standaard
`ai21labs_api_key`	De referentie naar de geheime sleutel van Azure Databricks voor een AI21 Labs-API-sleutel. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `ai21labs_api_key_plaintext`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `ai21labs_api_key` of `ai21labs_api_key_plaintext`.
`ai21labs_api_key_plaintext`	Een AI21 Labs-API-sleutel die is opgegeven als een tekenreeks zonder opmaak. Als u liever naar uw sleutel verwijst met behulp van Azure Databricks Secrets, raadpleegt u `ai21labs_api_key`.	U moet een API-sleutel opgeven met behulp van een van de volgende velden: `ai21labs_api_key` of `ai21labs_api_key_plaintext`.

Aangepaste leverancier

Configuratieparameter	Beschrijving	Vereist
`custom_provider_url`	De URL voor waar het model van de aangepaste provider zich bevindt. De URL moet verwijzen naar een specifiek API-eindpunt; bijvoorbeeld `https://api.provider.com/chat/completions`.	Ja
`bearer_token_auth`	Als de aangepaste provider bearer-tokenverificatie gebruikt, geeft u de vereiste velden op.	U moet een verificatiemethode opgeven met behulp van een van de volgende velden: `bearer_token_auth` of `api_key_auth`.
`token`	De verwijzing naar de geheime sleutel van Azure Databricks voor het token voor bearer-verificatie. Deze parameter moet worden genest onder `bearer_token_auth`. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `token_plaintext`.	Als u bearer-verificatie gebruikt, moet u een API-sleutel opgeven met behulp van een van de volgende velden: `token` of `token_plaintext`.
`token_plaintext`	Het token voor bearer-verificatie dat is opgegeven als een platte teksttekenreeks. Deze parameter moet worden genest onder `bearer_token_auth`. Zie `token`als u liever naar uw sleutel verwijst met behulp van Azure Databricks-geheimen.	Als u bearer-verificatie gebruikt, moet u een API-sleutel opgeven met behulp van een van de volgende velden: `token` of `token_plaintext`.
`api_key_auth`	Als de aangepaste provider API-sleutelverificatie gebruikt, geeft u de vereiste velden op.	U moet een verificatiemethode opgeven met behulp van een van de volgende velden: `bearer_token_auth` of `api_key_auth`.
`key`	De sleutel voor VERIFICATIE van API-sleutels. Deze parameter moet worden ondergebracht binnen `api_key_auth`	Ja, wanneer u API-sleutelverificatie gebruikt.
`value`	De Azure Databricks-geheime sleutelreferentie voor de waarde voor API-sleutelverificatie. Als u uw API-sleutel liever rechtstreeks plakt, raadpleegt u `value_plaintext`.	Als u API-sleutelverificatie gebruikt, moet u een API-sleutel opgeven met een van de volgende velden: `value` of `value_plaintext`.
`value_plaintext`	De waarde voor API-sleutelverificatie die is opgegeven als platte tekst. Zie `value`als u liever naar uw sleutel verwijst met behulp van Azure Databricks-geheimen.	Als u API-sleutelverificatie gebruikt, moet u een API-sleutel opgeven met een van de volgende velden: `value` of `value_plaintext`.

In het volgende voorbeeld ziet u hoe u een eindpunt maakt met een aangepaste provider met behulp van bearer-verificatie:

client.create_endpoint(
    name="custom-provider-completions-endpoint",
    config={
        "served_entities": [
            {
                "external_model": {
                    "name": "custom-provider-model",
                    "provider": "custom",
                    "task": "llm/v1/chat",
                    "custom_provider_config": {
                        "custom_provider_url": "https://api.provider.com/chat/completions",
                        "bearer_token_auth": {
                            "token": "{{secrets/my_custom_provider_secret_scope/custom_provider_token}}"
                        }
                    }
                }
            }
        ]
    },
)

In het volgende voorbeeld ziet u hoe u een eindpunt maakt met een aangepaste provider met behulp van API-sleutelverificatie:

client.create_endpoint(
    name="custom-provider-completions-endpoint",
    config={
        "served_entities": [
            {
                "external_model": {
                    "name": "custom-provider-model",
                    "provider": "custom",
                    "task": "llm/v1/chat",
                    "custom_provider_config": {
                        "custom_provider_url": "https://my-custom-provider.com",
                        "api_key_auth": {
                            "key": "X-API-KEY",
                            "value": "{{secrets/my_custom_provider_secret_scope/custom_provider_api_key}}"
                        }
                    }
                }
            }
        ]
    },
)

AI Gateway configureren op een eindpunt

U kunt uw eindpunt ook configureren om Mozaïek AI Gateway-functies in te schakelen, zoals snelheidsbeperking, gebruikstracering en kaders.

Zie AI Gateway configureren op modelbedienings-eindpunten.

Een query uitvoeren op een extern modeleindpunt

Nadat u een extern modeleindpunt hebt gemaakt, is het klaar om verkeer van gebruikers te ontvangen.

U kunt scoreaanvragen verzenden naar het eindpunt met behulp van de OpenAI-client, de REST API of de MLflow Deployments SDK.

Zie de standaardqueryparameters voor een scoringsverzoek in POST /serving-endpoints/{name}/aanroepen.
Basismodellen gebruiken

In het volgende voorbeeld wordt een query uitgevoerd op het claude-2 voltooiingsmodel dat wordt gehost door Antropic met behulp van de OpenAI-client. Als u de OpenAI-client wilt gebruiken, vult u het model veld in met de naam van het model dat als host fungeert voor het model dat u wilt opvragen.

In dit voorbeeld wordt een eerder gemaakt eindpunt gebruikt, anthropic-completions-endpointgeconfigureerd voor toegang tot externe modellen van de provider van het Antropische model. Zie hoe u externe modeleindpunten maakt.

Zie Ondersteunde modellen voor aanvullende modellen die u kunt opvragen en hun providers.

import os
import openai
from openai import OpenAI

client = OpenAI(
    api_key="dapi-your-databricks-token",
    base_url="https://example.staging.cloud.databricks.com/serving-endpoints"
)

completion = client.completions.create(
  model="anthropic-completions-endpoint",
  prompt="what is databricks",
  temperature=1.0
)
print(completion)

Verwachte uitvoerantwoordindeling:

{
"id": "123", # Not Required
"model": "anthropic-completions-endpoint",
"choices": [
  {
    "text": "Hello World!",
    "index": 0,
    "logprobs": null, # Not Required
    "finish_reason": "length" # Not Required
  }
],
"usage": {
  "prompt_tokens": 8,
  "total_tokens": 8
  }
}

Aanvullende query-parameters

U kunt eventuele aanvullende parameters doorgeven die worden ondersteund door de provider van het eindpunt als onderdeel van uw query.

Voorbeeld:

logit_bias (ondersteund door OpenAI, Cohere).
top_k (ondersteund door Anthropic, Cohere).
frequency_penalty (ondersteund door OpenAI, Cohere).
presence_penalty (ondersteund door OpenAI, Cohere).
stream (ondersteund door OpenAI, Antropicus, Cohere, Amazon Bedrock for Antropic). Dit is alleen beschikbaar voor chat- en voltooiingsaanvragen.

tools (ondersteund door OpenAI, Anthropic, Amazon Bedrock voor Anthropic). Dit is alleen beschikbaar voor chat- en voltooiingsaanvragen. Deze parameter maakt de integratie van externe functionaliteiten mogelijk, waaronder Computergebruik (Beta) voor Anthropic en Amazon Bedrock voor Anthropic. Zie Functie-aanroep op Azure Databricks.

Ondersteuning voor netwerkconnectiviteitsconfiguraties voor externe modellen

Ondersteuning voor netwerkconnectiviteitsconfiguraties (NCC's) voor externe modellen, waaronder Azure Private Link, bevindt zich in openbare preview. Neem contact op met uw Databricks-accountteam om deel te nemen aan de preview.

Beperkingen

Afhankelijk van het externe model dat u kiest, kan uw configuratie ertoe leiden dat uw gegevens worden verwerkt buiten de regio waar uw gegevens vandaan komen. Zie Limieten en regio's voor modelservering.