Introducción a la consulta de LLM en Databricks

2025-04-30

En este artículo se describe cómo empezar a usar las API de Foundation Model para servir y consultar los Modelos de lenguaje grande (LLM) en Databricks.

La manera más fácil de empezar a servir y consultar modelos LLM en Databricks es usar las API de Foundation Model de pago por token . Las API proporcionan acceso a modelos de base populares desde puntos de conexión de pago por token que están disponibles automáticamente en la interfaz de usuario de servicio del área de trabajo de Databricks. Consulte Modelos admitidos para las API de modelos de Databricks Foundation.

También puede probar y chatear con modelos de pago por token mediante AI Playground. Consulte Chatear con LLM y crear prototipos de aplicaciones de IA generativa con Área de juegos de IA.

En el caso de las cargas de trabajo de producción, especialmente aquellas con un modelo ajustado o que requieren garantías de rendimiento, Databricks recomienda usar las API de Foundation Model en un punto de conexión de rendimiento aprovisionado.

Requisitos

Área de trabajo de Databricks en una región compatible para las API de Foundation Model de pago por token.
Un token de acceso personal de Databricks para consultar y acceder a los puntos de conexión de servicio del modelo de IA de Mosaico mediante el cliente de OpenAI.

Importante

Como procedimiento recomendado de seguridad para escenarios de producción, Databricks recomienda usar tokens de OAuth de máquina a máquina para la autenticación durante la producción.

Para pruebas y desarrollo, Databricks recomienda usar un token de acceso personal que pertenezca a entidades de servicio en lugar de usuarios del área de trabajo. Para crear tokens para entidades de servicio, consulte Administración de tokens para una entidad de servicio.

Introducción al uso de las API de Foundation Model

El ejemplo siguiente está diseñado para ejecutarse en un cuaderno de Databricks. El ejemplo de código consulta el modelo Meta Llama 3.1 405B Instruct que se proporciona en el punto de conexión databricks-meta-llama-3-1-405b-instructde pago por token.

En este ejemplo, usará el cliente OpenAI para consultar el modelo rellenando el model campo con el nombre del punto de conexión de servicio del modelo que hospeda el modelo que desea consultar. Use el token de acceso personal para rellenar el DATABRICKS_TOKEN y la instancia del área de trabajo de Databricks para conectar el cliente de OpenAI a Databricks.

from openai import OpenAI
import os

DATABRICKS_TOKEN = os.environ.get("DATABRICKS_TOKEN")

client = OpenAI(
  api_key=DATABRICKS_TOKEN, # your personal access token
  base_url='https://<workspace_id>.databricks.com/serving-endpoints', # your Databricks workspace instance
)

chat_completion = client.chat.completions.create(
  messages=[
    {
      "role": "system",
      "content": "You are an AI assistant",
    },
    {
      "role": "user",
      "content": "What is a mixture of experts model?",
    }
  ],
  model="databricks-meta-llama-3-1-405b-instruct",
  max_tokens=256
)

print(chat_completion.choices[0].message.content)

Nota:

Si encuentra el siguiente mensaje ImportError: cannot import name 'OpenAI' from 'openai', actualice la versión de openai mediante !pip install -U openai. Después de instalar el paquete, ejecute dbutils.library.restartPython().

Resultado esperado:


{
  "id": "xxxxxxxxxxxxx",
  "object": "chat.completion",
  "created": "xxxxxxxxx",
  "model": "databricks-meta-llama-3-1-405b-instruct",
  "choices": [
    {
      "index": 0,
      "message":
        {
          "role": "assistant",
          "content": "A Mixture of Experts (MoE) model is a machine learning technique that combines the predictions of multiple expert models to improve overall performance. Each expert model specializes in a specific subset of the data, and the MoE model uses a gating network to determine which expert to use for a given input."
        },
      "finish_reason": "stop"
    }
  ],
  "usage":
    {
      "prompt_tokens": 123,
      "completion_tokens": 23,
      "total_tokens": 146
    }
}

Compartir a través de

Introducción a la consulta de LLM en Databricks

Requisitos

Introducción al uso de las API de Foundation Model

Comentarios

Recursos adicionales