Partager via


serving-endpoints groupe de commande

Note

Ces informations s’appliquent à Databricks CLI versions 0.205 et ultérieures. L’interface CLI Databricks est en préversion publique.

L’utilisation de l’interface CLI Databricks est soumise à la licence Databricks et à la notification de confidentialité Databricks, y compris les dispositions relatives aux données d’utilisation.

Le groupe de commandes serving-endpoints dans le CLI Databricks vous permet de créer, mettre à jour et supprimer des points de terminaison de service de modèles. Consultez Gérer les points de terminaison de mise en service de modèles.

Databricks points de terminaison de service journaux de construction

Récupère les journaux de génération associés au modèle servi spécifié.

databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service auquel appartient le modèle servi. Ce champ est obligatoire.

SERVED_MODEL_NAME

    Nom du modèle servi pour lequel les journaux de génération seront récupérés. Ce champ est obligatoire.

Options

Indicateurs globaux

databricks points-de-servir create

Crée un nouveau point de terminaison de service.

databricks serving-endpoints create NAME [flags]

Arguments

NAME

    Le nom de l’endpoint de service. Ce champ est obligatoire et doit être unique dans un espace de travail Databricks. Un nom de point de terminaison peut se composer de caractères alphanumériques, de tirets et de traits de soulignement.

Options

--budget-policy-id string

    Stratégie budgétaire à appliquer au point de terminaison de service.

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

--no-wait

    n’attendez pas d’atteindre l’état NOT_UPDATING

--route-optimized

    Activez l’optimisation de l’itinéraire pour le point de terminaison de service.

--timeout duration

    durée maximale d’atteindre l’état NOT_UPDATING (20m0s par défaut)

Indicateurs globaux

suppression des points de terminaison de service databricks

Supprimez un point de terminaison de service.

databricks serving-endpoints delete NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service à supprimer.

Options

Indicateurs globaux

databricks points de terminaison de service exporter-mesures

Récupère les métriques associées au point de terminaison de service spécifié, au format d’exposition Prometheus ou OpenMetrics.

databricks serving-endpoints export-metrics NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service pour lequel récupérer les métriques. Ce champ est obligatoire.

Options

Indicateurs globaux

databricks points de terminaison get

Récupérez les détails d’un point de terminaison de service unique.

databricks serving-endpoints get NAME [flags]

Arguments

NAME

    Le nom de l’endpoint de service. Ce champ est obligatoire.

Options

Indicateurs globaux

databricks serving-endpoints get-open-api

Obtenez le schéma de requête du point de terminaison de service au format OpenAPI. Le schéma contient des informations sur les chemins d’accès pris en charge, le format d’entrée et de sortie et les types de données.

databricks serving-endpoints get-open-api NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service auquel appartient le modèle servi. Ce champ est obligatoire.

Options

Indicateurs globaux

liste des points de terminaison de service databricks

Obtenez tous les endpoints de service.

databricks serving-endpoints list [flags]

Arguments

None

Options

Indicateurs globaux

journaux des points de terminaison de service databricks

Récupère les journaux de service associés au modèle servi spécifié.

databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service auquel appartient le modèle servi. Ce champ est obligatoire.

SERVED_MODEL_NAME

    Nom du modèle servi pour lequel les journaux seront récupérés. Ce champ est obligatoire.

Options

Indicateurs globaux

correctif databricks points de terminaison de service

Ajoutez ou supprimez des balises d’un point de terminaison de service.

databricks serving-endpoints patch NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service dont les balises doivent être corrigées. Ce champ est obligatoire.

Options

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

Indicateurs globaux

databricks points de terminaison de service put

Mettre à jour les limites de débit d’un point de terminaison de service.

Note

Déconseillé : utilisez la passerelle IA pour gérer les limites de débit à la place.

databricks serving-endpoints put NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service dont les limites de débit sont mises à jour. Ce champ est obligatoire.

Options

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

Indicateurs globaux

databricks serving-endpoints put-ai-gateway

Mettez à jour la passerelle IA d’un point de terminaison de service. Les points de terminaison de modèle externe, de débit provisionné et de paiement par jeton sont entièrement pris en charge ; Actuellement, les points de terminaison d’agent prennent uniquement en charge les tables d’inférence.

databricks serving-endpoints put-ai-gateway NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service dont la passerelle AI est mise à jour. Ce champ est obligatoire.

Options

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

Indicateurs globaux

requête databricks serving-endpoints

Interroge un point de terminaison de service.

databricks serving-endpoints query NAME [flags]

Arguments

NAME

    Le nom de l’endpoint de service. Ce champ est obligatoire.

Options

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

--max-tokens int

    Champ de jetons maximal utilisé uniquement pour les complétions et les points de terminaison du modèle externe et fondation de conversation.

--n int

    Champ n (nombre de candidats) utilisé UNIQUEMENT pour les autocomplétions et pour les points de terminaison du modèle de fondation et de conversation externe.

--stream

    Champ de flux utilisé UNIQUEMENT pour les complétions et le modèle de chat externe et le modèle de base pour desservir les points de terminaison.

--temperature float

    Champ de température utilisé uniquement pour les complétions et modèle de chat externe et de base pour servir des points de terminaison.

Indicateurs globaux

databricks serving-endpoints update-config

Mettez à jour toute combinaison des entités servies du point de terminaison de service, de la configuration de calcul de ces entités servies et de la configuration du trafic du point de terminaison. Un point de terminaison qui a déjà une mise à jour en cours ne peut pas être mis à jour tant que la mise à jour actuelle n’est pas terminée ou échoue.

databricks serving-endpoints update-config NAME [flags]

Arguments

NAME

    Nom du point de terminaison de service à mettre à jour. Ce champ est obligatoire.

Options

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

--no-wait

    n’attendez pas d’atteindre l’état NOT_UPDATING

--timeout duration

    durée maximale d’atteindre l’état NOT_UPDATING (20m0s par défaut)

Indicateurs globaux

databricks points de terminaison de service get-permission-levels

Récupère les niveaux d’autorisation du point de terminaison de service.

databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Point de terminaison de service pour lequel on souhaite obtenir ou gérer les autorisations.

Options

Indicateurs globaux

databricks serving-endpoints get-permissions

Récupère les autorisations du point de terminaison de service.

Récupère les autorisations d’un point de terminaison de service. Les points de terminaison de service peuvent hériter des autorisations de leur objet racine.

databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Point de terminaison de service pour lequel on souhaite obtenir ou gérer les autorisations.

Options

Indicateurs globaux

databricks service-endpoints set-permissions

Définissez les autorisations du point de terminaison de service.

databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Point de terminaison de service pour lequel on souhaite obtenir ou gérer les autorisations.

Options

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

Indicateurs globaux

databricks points de terminaison de service update-permissions

Mettez à jour les autorisations sur un point de terminaison. Les points de terminaison de service peuvent hériter des autorisations de leur objet racine.

databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Point de terminaison de service pour lequel on souhaite obtenir ou gérer les autorisations.

Options

--json JSON

    Chaîne JSON inline ou chemin @path vers le fichier JSON avec le corps de la requête.

Indicateurs globaux

Indicateurs globaux

--debug

  Active la journalisation du débogage.

-h ou --help

    Affiche l’aide pour l’interface CLI de Databricks, le groupe de commandes associé ou la commande concernée.

--log-file chaîne

    Chaîne représentant le fichier dans lequel écrire les journaux de sortie. Si cet indicateur n’est pas défini, les journaux de sortie sont écrits par défaut dans stderr.

--log-format format

    Format des journaux : text ou json. La valeur par défaut est text.

--log-level chaîne

    Chaîne représentant le niveau de journalisation. Si cet indicateur n’est pas défini, le niveau de format de journal est désactivé.

Type -o, --output

    Type de sortie de commande, text ou json. La valeur par défaut est text.

-p, --profile chaîne

    Nom du profil dans le ~/.databrickscfg fichier à utiliser pour exécuter la commande. Si cet indicateur n’est pas spécifié, s’il existe, le profil nommé DEFAULT est utilisé.

--progress-format format

    Format d’affichage des journaux d’activité de progression : default, append, inplace ou json

-t, --target chaîne

    Le cas échéant, la cible d’offre groupée à utiliser