Compartir a través de


Modelos y regiones de Azure OpenAI para Foundry Agent Service

Nota:

En este artículo se hace referencia al portal de Microsoft Foundry (clásico).

🔄 Cambie a la nueva documentación de Microsoft Foundry si usa el nuevo portal.

Nota:

En este artículo se hace referencia al portal de Microsoft Foundry (nuevo).

Azure OpenAI modela los agentes de energía en el servicio Microsoft Foundry Agent. Este artículo le ayuda a elegir una combinación de modelo y región compatibles para la implementación. La elección del modelo y la región adecuados afectan a las funcionalidades, la latencia y el costo del agente.

Para usar estos modelos, necesita un proyecto de Microsoft Foundry con acceso al servicio Foundry Agent.

Microsoft Foundry ofrece dos tipos principales de implementaciones:

  • Estándar incluye una opción de implementación global que enruta el tráfico entre la infraestructura global de Azure para maximizar el rendimiento y la disponibilidad.
  • Aprovisionado también incluye una opción de implementación global. Puede comprar e implementar unidades de rendimiento aprovisionadas (PTU) en toda la infraestructura global de Azure para un rendimiento predecible.

Todas las implementaciones pueden realizar las mismas operaciones de inferencia. Sin embargo, la facturación, la escala y el rendimiento son considerablemente diferentes. Para más información sobre los tipos de implementación de Azure OpenAI, consulte Tipos de implementación para modelos de Microsoft Foundry.

Cómo usar esta página

Use las tablas de este artículo para elegir una combinación admitida de tipo de implementación, versión del modelo y región de Azure.

  • Tipo de implementación: use las pestañas para seleccionar el tipo de implementación que planea usar (estándar o aprovisionado).
  • Región: la columna Región muestra la región de Azure donde se implementa el modelo.
  • Marcadores de disponibilidad:
    • ✅: Soportado.
    • Celdas en blanco o -: No se admite.

Elegir un modelo

Seleccione un modelo en función de los requisitos del agente:

  • familia gpt-5 (gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat): razonamiento a escala de frontera para tareas complejas y de varios pasos. El registro es necesario para el acceso.
  • Familia gpt-4.1 (gpt-4.1, gpt-4.1-mini, gpt-4.1-nano): modelos rentables para cargas de trabajo de agentes de uso general.
  • familia gpt-4o (gpt-4o, gpt-4o-mini): funcionalidades bidireccionales con soporte de visión.
  • gpt-4 y gpt-35-turbo: modelos heredados para compatibilidad con versiones anteriores.

Sugerencia

Inicio rápido: Para la mayoría de los nuevos agentes, implemente gpt-4o, 2024-11-20 en sueciacentral o eastus2 mediante la implementación estándar global. Estas regiones tienen una amplia disponibilidad del modelo y baja latencia para la mayoría de los escenarios.

Modelos disponibles

Foundry Agent Service admite los siguientes modelos de Azure OpenAI en las regiones enumeradas.

Tenga en cuenta que la disponibilidad del modelo varía según la región y la nube. Algunas herramientas y funcionalidades requieren los modelos más recientes. Los siguientes modelos están disponibles en la API rest y los SDK.

Nota:

Nota:

Región gpt-5.2 gpt-5.1 gpt-5 gpt-5-mini gpt-5-nano gpt-5-chat gpt-4.1 gpt-4.1-nano gpt-4.1-mini gpt-4o (05-13) gpt-4o (08-06) gpt-4o (11-20) gpt-4o-mini gpt-4 gpt-4-turbo
australiaeast
brazilsouth
canadaeast
eastus
eastus2
francecentral
germanywestcentral
italynorth
japaneast
norwayeast
southafricanorth
southcentralus
southindia
swedencentral
switzerlandnorth
uksouth
westeurope
westus
westus3

Modelos que no son de OpenAI

Además de los modelos de Azure OpenAI, puede usar modelos vendidos directamente por Azure. Estos modelos ofrecen funcionalidades especializadas para casos de uso específicos, como el razonamiento determinista o la generación de alto rendimiento.

Modelos vendidos directamente por Azure:

  • MAI-DS-R1: razonamiento determinista y centrado en la precisión.
  • grok-4: razonamiento a escala de frontera para la resolución compleja de problemas de varios pasos.
  • grok-4-fast-reasoning: razonamiento agéntico acelerado optimizado para la automatización del flujo de trabajo.
  • grok-4-fast-non-reasoning: generación de alto rendimiento, baja latencia y enrutamiento del sistema.
  • grok-3: razonamiento sólido para flujos de trabajo complejos y de nivel del sistema.
  • grok-3-mini: modelo ligero optimizado para casos de uso interactivos y de gran volumen.
  • Llama-3.3-70B-Instruct: Modelo versátil para Q&A empresarial, soporte de decisión y orquestación del sistema.
  • Llama-4-Maverick-17B-128E-Instruct-FP8: modelo optimizado para FP8 que ofrece inferencia rápida y rentable.
  • DeepSeek-V3-0324: Comprensión bidireccional entre texto e imágenes.
  • DeepSeek-V3.1: razonamiento bidireccional mejorado y recuperación fundamentada.
  • DeepSeek-R1-0528: razonamiento avanzado de forma larga y de varios pasos.
  • gpt-oss-120b: modelo de ecosistema abierto que admite transparencia y reproducibilidad.

Visualización de todos los modelos admitidos por el agente en el portal de Foundry

Para ver una lista completa de los modelos admitidos en el portal de Foundry:

  1. Inicie sesión en Microsoft Foundry. Asegúrese de que el conmutador New Foundry está desactivado. Estos pasos hacen referencia a Foundry (clásico).
    Inicie sesión en Microsoft Foundry. Asegúrese de que el interruptor New Foundry está activado. Estos pasos hacen referencia a Foundry (nuevo).
  2. Vaya al Catálogo de Modelos.
  3. Filtre los modelos por Funcionalidades y seleccione Agente admitido.
  1. Inicie sesión en Microsoft Foundry. Asegúrese de que el conmutador New Foundry está desactivado. Estos pasos hacen referencia a Foundry (clásico).
    Inicie sesión en Microsoft Foundry. Asegúrese de que el interruptor New Foundry está activado. Estos pasos hacen referencia a Foundry (nuevo).
  2. Seleccione Detectar en el panel de navegación superior derecho y, a continuación, Modelos en el panel izquierdo.
  3. Abra la lista desplegable Funcionalidades y seleccione el filtro compatible con el agente .

Comprobación de la compatibilidad del modelo

La disponibilidad del modelo puede cambiar con el tiempo.

  • Para verificar qué puede desplegar para su proyecto y región, utilice la experiencia del modelo del portal Foundry descrita en la sección anterior.
  • Si usa el rendimiento aprovisionado, asegúrese de que ha aprovisionado unidades de rendimiento (PTU) disponibles en la región de destino. Para obtener antecedentes, consulte Rendimiento aprovisionado.

Solución de problemas

Un modelo o una versión no están disponibles en su región

  • Confirme que seleccionó la pestaña derecha para el tipo de implementación.
  • Pruebe otra región que admita el modelo y la versión.
  • Si está utilizando los modelos gpt-5, asegúrese de que su suscripción tenga acceso. Algunos modelos requieren registro.

La búsqueda de archivos no está disponible

  • La búsqueda de archivos no está disponible en Norte de Italia y Sur de Brasil. Elija una región admitida o use otra herramienta.

Error en la implementación del rendimiento aprovisionado