Compartir a través de


Implementación de modelos de Fundición de IA de Azure con facturación de pago por uso en un proceso administrado

Los modelos de Azure AI Foundry incluyen un catálogo completo de modelos organizados en dos categorías: modelos vendidos directamente por Azure y Modelos de asociados y comunidad. Estos modelos de asociados y comunidad, que están disponibles para la implementación en un proceso administrado, son modelos abiertos o protegidos. En este artículo, aprenderá a usar modelos protegidos de asociados y comunidad, que se ofrecen a través de Azure Marketplace para la implementación en un proceso administrado con facturación de pago por uso.

Prerrequisitos

  • Una suscripción de Azure con un método de pago válido. Las suscripciones gratuitas o de evaluación de Azure no funcionarán. Si no tiene una suscripción de Azure, cree una cuenta de Azure de pago para comenzar.

  • Si no tiene uno, cree un proyectobasado en concentrador.

  • Habilitadas las compras de Azure Marketplace para tu suscripción de Azure.

  • Los controles de acceso basados en roles de Azure (Azure RBAC) se utilizan para otorgar acceso a las operaciones en el portal de Azure AI Foundry. Para realizar los pasos descritos en este artículo, la cuenta de usuario debe tener asignado un rol personalizado con los permisos siguientes. Las cuentas de usuario asignadas al rol Propietario o Colaborador de la suscripción de Azure también pueden crear implementaciones. Para más información sobre los permisos, consulte el control de acceso basado en roles en el portal de Azure AI Foundry.

  • En la suscripción de Azure: para suscribir el área de trabajo o el proyecto a la oferta de Azure Marketplace:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • En el grupo de recursos: para crear y usar el recurso de SaaS:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • En el área de trabajo, para implementar puntos de conexión:

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/onlineEndpoints/*

Ámbito de suscripción y unidad de medida para la oferta de Azure Marketplace

Fundición de IA de Azure permite una suscripción sin problemas y una experiencia de transacción para los modelos protegidos a medida que crea y consume las implementaciones de modelos dedicadas a escala. La implementación de modelos protegidos en el procesamiento gestionado implica la facturación de pago por uso para el cliente en dos aspectos diferentes:

  • Facturación por hora de computación de Azure Machine Learning para las máquinas virtuales empleadas en la implementación.
  • Facturación por adicional del modelo según lo establecido por el publicador de modelos en la oferta de Azure Marketplace.

La facturación de pago por uso del proceso de Azure y el suplemento del modelo son prorrateado por minuto en función del tiempo de actividad de las implementaciones en línea administradas. El suplemento de un modelo es un precio por hora de GPU, establecido por el socio (o publicador del modelo) en Azure Marketplace, para todas las GPU admitidas que pueden utilizarse para implementar el modelo en el cómputo administrado de Azure AI Foundry.

La suscripción de un usuario a las ofertas de Azure Marketplace se limita al recurso del proyecto en Azure AI Foundry. Si ya existe una suscripción a la oferta de Azure Marketplace para un modelo determinado dentro del proyecto, se informa al usuario en el Asistente para la implementación de que la suscripción ya existe para el proyecto.

Para buscar todas las suscripciones de SaaS que existen en una suscripción de Azure:

  1. Inicie sesión en Azure Portal y vaya a su suscripción de Azure.

  2. Seleccione Suscripciones y, a continuación, seleccione la suscripción de Azure para abrir su página de información general.

  3. Seleccione Configuración>Recursos para ver la lista de recursos.

  4. Use el filtro Tipo para seleccionar el tipo de recurso SaaS.

El suplemento basado en el consumo se acumula en la suscripción de SaaS asociada y se factura a un usuario a través de Azure Marketplace. Puede ver la factura en la pestaña Información general de la suscripción de SaaS correspondiente.

Suscripción e implementación en un proceso administrado

  1. Inicie sesión en Azure AI Foundry.

  2. Si aún no estás en tu proyecto, selecciónalo.

  3. Seleccione Catálogo de modelos en el panel izquierdo.

  4. Seleccione el filtro Opciones de implementación en el catálogo de modelos y elija Proceso administrado.

  5. Filtre aún más la lista seleccionando la colección y el modelo que prefiera. En este artículo, usamos cohere Command A en la lista de modelos admitidos para la ilustración.

  6. En la página del modelo, seleccione Usar este modelo para abrir el Asistente para la implementación.

  7. Elija una de las SKU de máquina virtual admitidas para el modelo. Debe tener cuota de proceso de Azure Machine Learning para esa SKU en su suscripción de Azure.

  8. Seleccione Personalizar para especificar la configuración de implementación para parámetros como el recuento de instancias. También puede seleccionar un punto de conexión existente para la implementación o crear uno nuevo. En este ejemplo, se especifica un recuento de instancias de 1 y se crea un nuevo punto de conexión para la implementación.

    Captura de pantalla de la pantalla de configuración de implementación de un modelo protegido en Azure AI Foundry.

  9. Seleccione Siguiente para continuar con la página de desglose de precios .

  10. Revise el desglose de precios de la implementación, los términos de uso y el contrato de licencia asociados a la oferta del modelo en Azure Marketplace. El desglose de precios indica cuál sería el precio agregado del modelo implementado, donde el suplemento del modelo es una función del número de GPU de la instancia de máquina virtual seleccionada en los pasos anteriores. Además del adicional aplicable para el modelo, también se aplican cargos de proceso de Azure, en función de la configuración de implementación. Si tiene reservas existentes o un plan de ahorro de Azure, la factura de los cargos de cómputo respeta y refleja los precios con descuento de las máquinas virtuales.

    Captura de pantalla de la página de desglose de precios de una implementación de modelos protegida en Azure AI Foundry.

  11. Active la casilla para confirmar que comprende y acepta los términos de uso. A continuación, seleccione Implementar. Azure AI Foundry crea la suscripción del usuario a la oferta de Marketplace y, a continuación, crea la implementación del modelo en un proceso administrado. La implementación tarda aproximadamente entre 15 y 20 minutos en completarse.

Aislamiento de red de implementaciones

Las colecciones del catálogo de modelos se pueden implementar dentro de las redes aisladas mediante la red virtual administrada por el área de trabajo. Para obtener más información sobre cómo configurar las redes administradas del área de trabajo, consulte Configuración de una red virtual administrada para permitir la salida de Internet.

Limitación

Un proyecto de Fundición de IA de Azure y con acceso a la red pública de entrada deshabilitado solo puede admitir una sola implementación activa de uno de los modelos protegidos del catálogo. Los intentos de crear implementaciones más activas producen errores de creación de la implementación.

Modelos admitidos para la implementación de proceso administrada con facturación de pago por uso

Colección Modelo Tarea
Paige AI Virchow2G Extracción de características de imagen
Paige AI Virchow2G-Mini Extracción de características de imagen
Cohere Comando A Finalización del chat
Cohere Insertar v4 Incrustaciones
Cohere Rerank v3.5 Clasificación de texto
NVIDIA Llama-3.3-Nemotron-Super-49B-v1-NIM-microservice Finalización del chat
NVIDIA Llama-3.1-Nemotron-Nano-8B-v1-NIM-microservice Finalización del chat
NVIDIA Deepseek-R1-Distill-Llama-8B-NIM-microservice Finalización del chat
NVIDIA Llama-3.3-70B-Instruct-NIM-microservice Finalización del chat
NVIDIA Llama-3.1-8B-Instruct-NIM-microservice Finalización del chat
NVIDIA Mistral-7B-Instruct-v0.3-NIM-microservice Finalización del chat
NVIDIA Mixtral-8x7B-Instruct-v0.1-NIM-microservice Finalización del chat
NVIDIA Llama-3.2-NV-embedqa-1b-v2-NIM-microservice Incrustaciones
NVIDIA Llama-3.2-NV-rerankqa-1b-v2-NIM-microservice Clasificación de texto
NVIDIA Openfold2-NIM-microservice Enlazador de proteínas
NVIDIA ProteinMPNN-NIM-microservice Enlazador de proteínas
NVIDIA MSA-search-NIM-microservice Enlazador de proteínas
NVIDIA Rfdiffusion-NIM-microservice Enlazador de proteínas