次の方法で共有


serving-endpoints コマンド グループ

Note

この情報は、Databricks CLI バージョン 0.205 以降に適用されます。 Databricks CLI は パブリック プレビュー段階です

Databricks CLI の使用には、Databricks ライセンスおよび使用状況データのプロビジョニングを含むDatabricks のプライバシーに関する通知が適用されます。

serving-endpoints 内の コマンド グループを使用すると、エンドポイントを提供するモデルを作成、更新、および削除できます。 「エンドポイントを提供するモデルの管理」を参照してください。

databricks サービングエンドポイントのビルドログ

提供されたモデルに関連付けられているビルドログを取得します。

databricks serving-endpoints build-logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    サービス提供されたモデルが属するサービス エンドポイントの名前。 このフィールドは必須です。

SERVED_MODEL_NAME

    ビルド ログ取得先の提供されるモデルの名前。 このフィールドは必須です。

オプション

グローバル フラグ

databricks のサービングエンドポイントの作成コマンド: databricks serving-endpoints create

新しいサービス エンドポイントを作成します。

databricks serving-endpoints create NAME [flags]

Arguments

NAME

    Serving エンドポイントの名前 このフィールドは必須であり、Databricks ワークスペース全体で一意である必要があります。 エンドポイント名は、英数字、ダッシュ、およびアンダースコアで構成できます。

オプション

--budget-policy-id string

    サービス エンドポイントに適用される予算ポリシー。

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

--no-wait

    NOT_UPDATING状態に達するのを待たない

--route-optimized

    サービス エンドポイントのルート最適化を有効にします。

--timeout duration

    NOT_UPDATING状態に達するまでの最大時間 (既定は 20m0 秒)

グローバル フラグ

databricks serving-endpoints delete

サービス エンドポイントを削除します。

databricks serving-endpoints delete NAME [flags]

Arguments

NAME

    削除するサービス エンドポイントの名前。

オプション

グローバル フラグ

databricks serving-endpoints export-metrics

提供されたサービス エンドポイントに関連付けられているメトリックを Prometheus または OpenMetrics の表示形式で取得します。

databricks serving-endpoints export-metrics NAME [flags]

Arguments

NAME

    メトリックを取得するサービス エンドポイントの名前。 このフィールドは必須です。

オプション

グローバル フラグ

databricks serving-endpoints get

1 つのサービス エンドポイントの詳細を取得します。

databricks serving-endpoints get NAME [flags]

Arguments

NAME

    Serving エンドポイントの名前 このフィールドは必須です。

オプション

グローバル フラグ

databricks サービングエンドポイント get-open-api

サービス エンドポイントのクエリ スキーマを OpenAPI 形式で取得します。 スキーマには、サポートされているパス、入力と出力の形式、およびデータ型に関する情報が含まれています。

databricks serving-endpoints get-open-api NAME [flags]

Arguments

NAME

    サービス提供されたモデルが属するサービス エンドポイントの名前。 このフィールドは必須です。

オプション

グローバル フラグ

databricks serving-endpoints list(Databricksのサービングエンドポイントのリストを表示するコマンド)

すべてのサービス エンドポイントを取得します。

databricks serving-endpoints list [flags]

Arguments

None

オプション

グローバル フラグ

databricks サービングエンドポイントログ

提供されたサービス モデルに関連付けられているサービス ログを取得します。

databricks serving-endpoints logs NAME SERVED_MODEL_NAME [flags]

Arguments

NAME

    サービス提供されたモデルが属するサービス エンドポイントの名前。 このフィールドは必須です。

SERVED_MODEL_NAME

    ログを取得する対象となる、提供されるモデルの名前。 このフィールドは必須です。

オプション

グローバル フラグ

databricks サービングエンドポイント パッチ

サービス エンドポイントのタグを追加または削除します。

databricks serving-endpoints patch NAME [flags]

Arguments

NAME

    タグを修正する対象であるサービングエンドポイントの名前。 このフィールドは必須です。

オプション

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

グローバル フラグ

databricks サービングエンドポイント put

サービス エンドポイントのレート制限を更新します。

Note

非推奨: 代わりに AI ゲートウェイを使用してレート制限を管理してください。

databricks serving-endpoints put NAME [flags]

Arguments

NAME

    レート制限が更新されるサービス エンドポイントの名前。 このフィールドは必須です。

オプション

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

グローバル フラグ

データブリックス サービングエンドポイント AIゲートウェイ設置

サービス エンドポイントの AI ゲートウェイを更新します。 外部モデル、プロビジョニング済みスループット、トークンごとの支払いエンドポイントが完全にサポートされています。現在、エージェント エンドポイントは推論テーブルのみをサポートしています。

databricks serving-endpoints put-ai-gateway NAME [flags]

Arguments

NAME

    AI ゲートウェイが更新されるサービス エンドポイントの名前。 このフィールドは必須です。

オプション

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

グローバル フラグ

databricks サービングエンドポイントのクエリ

サービス エンドポイントに対してクエリを実行します。

databricks serving-endpoints query NAME [flags]

Arguments

NAME

    Serving エンドポイントの名前 このフィールドは必須です。

オプション

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

--max-tokens int

    エンドポイントを提供する 入力候補チャット外部および基礎モデル にのみ使用される最大トークン フィールド。

--n int

    n (候補の数) フィールドは、補完チャットの外部エンドポイントおよび基礎モデルのエンドポイントにのみ使用されます。

--stream

    ストリームフィールドは、補完およびチャット外部&基礎モデルの提供エンドポイントにのみ使用されます。

--temperature float

    エンドポイント提供に使用される温度フィールドは、補完および外部チャットおよびファンデーションモデルにのみ適用されます。

グローバル フラグ

databricks サービングエンドポイントの設定を更新

サービス エンドポイントのサービス対象エンティティ、それらのサービス対象エンティティのコンピューティング構成、エンドポイントのトラフィック構成の任意の組み合わせを更新します。更新が既に進行中のエンドポイントは、現在の更新が完了するか失敗するまで更新できません。

databricks serving-endpoints update-config NAME [flags]

Arguments

NAME

    更新するサービス エンドポイントの名前。 このフィールドは必須です。

オプション

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

--no-wait

    NOT_UPDATING状態に達するのを待たない

--timeout duration

    NOT_UPDATING状態に達するまでの最大時間 (既定は 20m0 秒)

グローバル フラグ

databricks serving-endpoints get-permission-levels

サービス エンドポイントのアクセス許可レベルを取得します。

databricks serving-endpoints get-permission-levels SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    アクセス許可を取得または管理するサービス エンドポイント。

オプション

グローバル フラグ

databricks serving-endpoints get-permissions

サービングエンドポイントのアクセス許可を取得します。

サービス エンドポイントのアクセス許可を取得します。 サービス エンドポイントは、ルート オブジェクトからアクセス許可を継承できます。

databricks serving-endpoints get-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    アクセス許可を取得または管理するサービス エンドポイント。

オプション

グローバル フラグ

databricks サービングエンドポイント 許可設定

サービス エンドポイントのアクセス許可を設定します。

databricks serving-endpoints set-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    アクセス許可を取得または管理するサービス エンドポイント。

オプション

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

グローバル フラグ

Databricks サービングエンドポイントの権限を更新する

サービス エンドポイントのアクセス許可を更新します。 サービス エンドポイントは、ルート オブジェクトからアクセス許可を継承できます。

databricks serving-endpoints update-permissions SERVING_ENDPOINT_ID [flags]

Arguments

SERVING_ENDPOINT_ID

    アクセス許可を取得または管理するサービス エンドポイント。

オプション

--json JSON

    要求本文を含む JSON ファイルに対するインライン JSON 文字列または @path。

グローバル フラグ

グローバル フラグ

--debug

  デバッグ ログを有効にするかどうかを指定します。

-h または --help

    Databricks CLI、または関連コマンド グループ、または関連コマンドのヘルプの表示。

--log-file 文字列

    出力ログを書き込むファイルを表す文字列。 このフラグが指定されていない場合、既定では stderr に出力ログが書き込まれます。

--log-format 形式

    ログ形式の種類、 text 、または json。 既定値は text です。

--log-level 文字列

    ログ形式レベルを表す文字列。 指定しない場合、ログ形式レベルは無効になります。

-o, --output

    コマンド出力の種類( text または json)。 既定値は text です。

-p, --profile 文字列

    コマンドの実行に使用する ~/.databrickscfg ファイル内のプロファイルの名前。 このフラグが指定されていない場合は、存在する場合は、 DEFAULT という名前のプロファイルが使用されます。

--progress-format 形式

    進行状況ログを表示する形式: defaultappendinplace、または json

-t, --target 文字列

    該当する場合は、使用するバンドル ターゲット