Поделиться через


serving-endpoints группа команд

Note

Эта информация относится к Интерфейсу командной строки Databricks версии 0.205 и выше. Интерфейс командной строки Databricks находится в общедоступной предварительной версии.

Использование интерфейса командной строки Databricks подчиняется лицензии Databricks и уведомлению о конфиденциальности Databricks, включая любые положения о данных использования.

Группа serving-endpoints команд в интерфейсе командной строки Databricks позволяет создавать, обновлять и удалять конечные точки обслуживания моделей. См. раздел Управление конечными точками обслуживания моделей.

databricks конечные точки обслуживания журналы сборки

Извлеките журналы сборки, связанные с предоставленной обслуживаемой моделью.

databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания, к которой принадлежит обслуживаемая модель. Это поле является обязательным.

SERVED_MODEL_NAME

    Имя обслуживаемой модели, для которую будут получены журналы сборки. Это поле является обязательным.

Options

Глобальные флаги

создание конечных точек обслуживания databricks

Создайте новую конечную точку обслуживания.

databricks serving-endpoints create NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания. Это поле является обязательным и должно быть уникальным в рабочей области Databricks. Имя конечной точки может состоять из буквенно-цифровых символов, дефисов и символов подчеркивания.

Options

--budget-policy-id string

    Политика бюджета, применяемая к конечной точке обслуживания.

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

--no-wait

    Не ждите достижения состояния NOT_UPDATING

--route-optimized

    Включите оптимизацию маршрута для конечной точки обслуживания.

--timeout duration

    максимальное время достижения состояния NOT_UPDATING (по умолчанию 20m0s)

Глобальные флаги

удаление серверных конечных точек в Databricks

Удаление конечной точки обслуживания.

databricks serving-endpoints delete NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания для удаления.

Options

Глобальные флаги

Экспорт метрик обслуживающих конечных точек Databricks

Получите метрики, ассоциированные с предоставленной конечной точкой обслуживания, в формате экспонирования Prometheus или OpenMetrics.

databricks serving-endpoints export-metrics NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания для получения метрик. Это поле является обязательным.

Options

Глобальные флаги

получение конечных точек сервиса Databricks

Получите сведения для одной конечной точки обслуживания.

databricks serving-endpoints get NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания. Это поле является обязательным.

Options

Глобальные флаги

databricks, обслуживающие конечные точки get-open-api

Получите схему запроса конечной точки обслуживания в формате OpenAPI. Схема содержит сведения о поддерживаемых путях, входных и выходных форматах и типах данных.

databricks serving-endpoints get-open-api NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания, к которой принадлежит обслуживаемая модель. Это поле является обязательным.

Options

Глобальные флаги

список конечных точек обслуживания Databricks

Получение всех конечных точек обслуживания.

databricks serving-endpoints list [flags]

Arguments

None

Options

Глобальные флаги

журналы обслуживания конечных точек Databricks

Извлеките журналы служб, связанные с предоставленной обслуживаемой моделью.

databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания, к которой принадлежит обслуживаемая модель. Это поле является обязательным.

SERVED_MODEL_NAME

    Имя обслуживаемой модели, для которой будут извлекаться журналы. Это поле является обязательным.

Options

Глобальные флаги

исправление для конечных точек обслуживания Databricks

Добавить или удалить теги конечной точки обслуживания.

databricks serving-endpoints patch NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания, теги которой нужно обновить. Это поле является обязательным.

Options

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

Глобальные флаги

конечные точки обслуживания Databricks put

Ограничения скорости обновления конечной точки обслуживания.

Note

Не рекомендуется. Вместо этого используйте шлюз искусственного интеллекта для управления ограничениями скорости.

databricks serving-endpoints put NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания, ограничения скорости которой обновляются. Это поле является обязательным.

Options

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

Глобальные флаги

databricks, обслуживающие конечные точки put-ai-gateway

Обновите шлюз искусственного интеллекта конечной точки обслуживания. Внешняя модель, зарезервированная пропускная способность и конечные точки с оплатой за токен полностью поддерживаются; Конечные точки агента в настоящее время поддерживают только таблицы вывода.

databricks serving-endpoints put-ai-gateway NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания, шлюз ИИ которой обновляется. Это поле является обязательным.

Options

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

Глобальные флаги

запрос конечных точек обслуживания Databricks

Запрос конечной точки обслуживания.

databricks serving-endpoints query NAME [flags]

Arguments

NAME

    Имя конечной точки обслуживания. Это поле является обязательным.

Options

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

--max-tokens int

    Поле максимальных маркеров, используемое только для дополнений и внешнего чата и базовых моделей обслуживания конечных точек.

--n int

    Поле n (число кандидатов), используемое только для завершений и чата внешних и основных моделей для обслуживания конечных точек.

--stream

    Поле потока, используемое только для автозаполнений и обслуживания внешних чатов и базовых моделей конечных точек.

--temperature float

    Поле температуры, используемое ТОЛЬКО для завершений и внешних чатов и базовых моделей в обслуговванних конечных точках.

Глобальные флаги

databricks, обслуживающие конечные точки update-config

Обновите любое сочетание обслуживаемых сущностей конечной точки обслуживания, конфигурацию вычислений этих обслуживаемых сущностей и конфигурацию трафика конечной точки. Конечная точка, которая уже имеет обновление, не может быть обновлена до тех пор, пока текущее обновление не завершится или завершится сбоем.

databricks serving-endpoints update-config NAME [flags]

Arguments

NAME

    Имя обновляемой конечной точки обслуживания. Это поле является обязательным.

Options

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

--no-wait

    Не ждите достижения состояния NOT_UPDATING

--timeout duration

    максимальное время достижения состояния NOT_UPDATING (по умолчанию 20m0s)

Глобальные флаги

databricks конечные точки обслуживания get-permission-levels

Получить уровни разрешений обслуживающей конечной точки.

databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Конечная точка обслуживания, для которой требуется получить или управлять разрешениями.

Options

Глобальные флаги

databricks конечные точки обслуживания получение доступа к разрешениям

Получение разрешений конечной точки обслуживания.

Получает разрешения конечной точки обслуживания. Обслуживающие конечные точки могут наследовать разрешения от корневого объекта.

databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Конечная точка обслуживания, для которой требуется получить или управлять разрешениями.

Options

Глобальные флаги

databricks, настройка разрешений для обслуживаемых конечных точек

Задайте разрешения для обслуживания конечной точки.

databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Конечная точка обслуживания, для которой требуется получить или управлять разрешениями.

Options

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

Глобальные флаги

databricks, конечные точки сервиса, обновление разрешений

Обновите разрешения для конечной точки обслуживания. Обслуживающие конечные точки могут наследовать разрешения от корневого объекта.

databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    Конечная точка обслуживания, для которой требуется получить или управлять разрешениями.

Options

--json JSON

    Строка JSON inline или @path к JSON-файлу с телом запроса.

Глобальные флаги

Глобальные флаги

--debug

  Следует ли включить ведение журнала отладки.

-h или --help

    Отобразить справку по интерфейсу командной строки Databricks, связанной группе команд или отдельной команде.

--log-file струна

    Строка, представляющая файл для записи журналов выходных данных. Если этот флаг не указан, по умолчанию используется запись журналов выходных данных в stderr.

--log-format формат

    Тип формата журнала: text или json. Значение по умолчанию — text.

--log-level струна

    Строка, представляющая уровень формата журнала. Если не указано, уровень формата журнала отключен.

типа -o, --output

    Тип выходных данных команды: text или json. Значение по умолчанию — text.

-p, --profile струна

    Имя профиля в ~/.databrickscfg файле, используемого для выполнения команды. Если флаг не указан, используется профиль DEFAULT, если он существует.

--progress-format формат

    Формат для отображения журналов хода выполнения: default, appendinplace, илиjson

-t, --target струна

    Если применимо, целевой объект пакета для использования