Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este artículo, aprenderá a implementar un modelo desde el catálogo de modelos como una implementación estándar.
Algunos modelos del catálogo de modelos se pueden implementar como una implementación estándar con facturación estándar. Este tipo de implementación proporciona una manera de consumir modelos como UNA API sin hospedarlos en su suscripción, al tiempo que mantiene la seguridad empresarial y el cumplimiento que necesitan las organizaciones. Esta opción de implementación no requiere cuota de la suscripción.
En este artículo se utiliza el despliegue de un modelo Meta Llama como ilustración. Sin embargo, puede usar los mismos pasos para implementar cualquiera de los modelos del catálogo de modelos que están disponibles para la implementación estándar.
Requisitos previos
Una suscripción de Azure con un método de pago válido. Las suscripciones gratuitas o de evaluación de Azure no funcionarán. Si no tiene una suscripción de Azure, cree una cuenta de Azure de pago para comenzar.
Los controles de acceso basado en rol de Azure (RBAC de Azure) se usan para conceder acceso a las operaciones en Azure Machine Learning. Para realizar los pasos descritos en este artículo, la cuenta de usuario debe tener asignado el rol Desarrollador de Azure AI en el grupo de recursos. Para más información sobre los permisos, consulte Control de acceso basado en rol en Azure Machine Learning.
Es necesario instalar el siguiente software para trabajar con Azure Machine Learning:
Puede usar cualquier explorador web compatible para navegar por Azure Machine Learning.
Busque el modelo y el identificador del modelo en el catálogo de modelos
Inicie sesión en Azure Machine Learning Studio.
En el caso de los modelos que se ofrecen a través de Azure Marketplace, asegúrese de que su cuenta tiene permisos de rol de desarrollador de Azure AI en el grupo de recursos o que cumple los permisos necesarios para suscribirse a las ofertas del modelo.
Los modelos que ofrecen proveedores que no son de Microsoft (por ejemplo, modelos Llama y Mistral) se facturan a través de Azure Marketplace. Para estos modelos, es necesario suscribir el área de trabajo a la oferta de modelo concreta. Los modelos que ofrece Microsoft (por ejemplo: los modelos Phi-3) no tienen este requisito, ya que la facturación se realiza de forma diferente. Para más información sobre la facturación para la implementación sin servidor de modelos en el catálogo de modelos, consulte Facturación de implementaciones estándar.
Vaya a su área de trabajo. Para usar la oferta de implementación estándar, el área de trabajo debe pertenecer a una de las regiones que se admiten para la implementación sin servidor para el modelo determinado que desea implementar.
Seleccione Catálogo de modelos en la barra lateral izquierda y busque la tarjeta de modelo del modelo que desea implementar. En este artículo, seleccionará un modelo Bria-2.3-Fast.
- Si va a implementar el modelo mediante la CLI de Azure, el SDK de Python o ARM, copie el identificador de modelo.
Importante
No incluya la versión al copiar el identificador del modelo. Las implementaciones estándar siempre implementan la versión más reciente del modelo disponible. Por ejemplo, para el identificador de modelo
azureml://registries/azureml-bria/models/Bria-2.3-Fast/versions/1, copieazureml://registries/azureml-bria/models/Bria-2.3-Fast.
En la sección siguiente se describen los pasos para suscribir su área de trabajo a una oferta de modelo. Puede omitir esta sección y ir a Implementar el modelo en una implementación estándar, si va a implementar un modelo de Microsoft.
Suscripción del área de trabajo a la oferta del modelo
Las implementaciones estándar pueden desplegar tanto modelos de Microsoft como modelos que no son de Microsoft. En el caso de los modelos de Microsoft (como los modelos Phi-3), no es necesario crear una suscripción de Azure Marketplace y puede implementarlas en implementaciones estándar directamente para consumir sus predicciones. Para los modelos que no son de Microsoft, primero debe crear la suscripción. Si es la primera vez que implementa el modelo en el área de trabajo, debe suscribir su área de trabajo a la oferta específica de modelo de Azure Marketplace. Cada área de trabajo tiene su propia suscripción a la oferta concreta de Azure Marketplace del modelo, lo que le permite controlar y supervisar los gastos.
Nota:
Los modelos ofrecidos a través de Azure Marketplace están disponibles para la implementación en implementaciones estándar en regiones específicas. Compruebe La disponibilidad de regiones de los modelos en las implementaciones estándar para comprobar qué modelos y regiones están disponibles. Si no aparece la lista que necesita, puede implementar en un área de trabajo en una región admitida y, a continuación, consumir implementaciones estándar desde un área de trabajo diferente.
Cree la suscripción de Marketplace del modelo. Al crear una suscripción, acepta los términos y condiciones asociados a la oferta del modelo. Recuerde que no es necesario realizar este paso para los modelos que ofrece Microsoft (como Phi-3).
En la página Detalles del modelo, seleccione Usar este modelo. Se abre una ventana Opciones de implementación, lo que proporciona la opción entre la implementación estándar (API sin servidor) y la implementación mediante un proceso administrado.
Nota:
En el caso de los modelos que solo se pueden implementar a través de la implementación estándar, el Asistente para la implementación estándar se abre justo después de seleccionar Usar este modelo en la página de detalles del modelo.
Seleccione API sin servidor para abrir el Asistente para la implementación estándar.
Si ve la nota Ya tiene una suscripción de Azure Marketplace para esta área de trabajo, no es necesario crear la suscripción, ya que ya tiene una. Puede continuar con Implementar el modelo en una implementación estándar.
En el Asistente para la implementación, selecciona el vínculo a Términos de Azure Marketplace para obtener más información sobre los términos de uso. También puede seleccionar la pestaña Precios y términos para obtener información sobre los precios del modelo seleccionado.
En el Asistente para la implementación, seleccione el vínculo a Términos de Azure Marketplace para obtener más información sobre los términos de uso. También puede seleccionar la pestaña Detalles de la oferta de Marketplace para obtener información sobre los precios del modelo seleccionado.
Seleccione Suscribir e implementar.
Una vez que suscribas el área de trabajo para la oferta concreta de Azure Marketplace, las implementaciones posteriores de la misma oferta en la misma área de trabajo no requieren la suscripción de nuevo.
En cualquier momento, puede ver las ofertas del modelo a las que está suscrito actualmente el área de trabajo:
Vaya a Azure Portal.
Vaya al grupo de recursos al que pertenece el área de trabajo.
En el filtroTipo, seleccione SaaS.
Verá todas las ofertas a las que está suscrito actualmente.
Seleccione cualquier recurso para ver los detalles.
Implementación del modelo en una implementación estándar
Una vez que haya creado una suscripción para un modelo que no sea de Microsoft, puede implementar el modelo asociado en una implementación estándar. Para los modelos de Microsoft (como los modelos Phi-3) no es necesario crear una suscripción.
La implementación estándar proporciona una manera de consumir modelos como UNA API sin hospedarlos en su suscripción, al tiempo que mantiene las necesidades de las organizaciones de seguridad y cumplimiento empresariales. Esta opción de implementación no requiere cuota de la suscripción.
En esta sección, creará un punto de conexión con el nombre Bria-2.3-Fast.
Creación del punto de conexión sin servidor
Para implementar un modelo de Microsoft que no requiera suscribirse a una oferta de modelo, seleccione Usar este modelo y, a continuación, seleccione API sin servidor para abrir el Asistente para la implementación.
Como alternativa, para un modelo que no sea de Microsoft que requiera una suscripción de modelo, si ha suscrito el área de trabajo a la oferta del modelo en la sección anterior, continúe seleccionando Implementar. Como alternativa, seleccione Continuar para implementar (si el asistente de implementación tenía la nota Ya tiene una suscripción de Azure Marketplace para esta área de trabajo).
Asigne un nombre a la implementación. Este nombre forma parte de la dirección URL de la API de implementación. Esta dirección URL debe ser única en cada región de Azure.
Sugerencia
La opción Filtro de contenido (versión preliminar) está habilitada de manera predeterminada. Deje la configuración predeterminada para que el servicio detecte contenido dañino, como odio, autolesión, contenido sexual y violento. Para obtener más información sobre el filtrado de contenido (versión preliminar), consulte Seguridad del contenido de los modelos implementados a través de implementaciones estándar.
Seleccione Implementar. Espere hasta que la implementación esté lista y se le redirigirá a la página Implementaciones.
En cualquier momento, puede ver los puntos de conexión desplegados en su área de trabajo.
Vaya a su área de trabajo.
Seleccione Puntos de conexión.
Seleccione la pestaña Puntos de conexión sin servidor para mostrar las implementaciones estándar.
El punto de conexión creado usa la autenticación de clave para la autorización. Siga estos pasos para obtener las claves asociadas a un punto de conexión determinado.
- Para volver a la página de la implementación, seleccione el nombre del punto de conexión en la lista de puntos de conexión sin servidor.
- Tenga en cuenta la Dirección URI de destino y la clave del punto de conexión. Úselos para llamar a la implementación y generar predicciones.
Nota:
Al usar Azure Portal, las implementaciones estándar no se muestran de forma predeterminada en el grupo de recursos. Use la opciónMostrar tipos ocultos para mostrarlos en el grupo de recursos.
En este momento, el punto de conexión está listo para usarse.
Si necesita consumir esta implementación desde un área de trabajo diferente o tiene previsto usar "prompt flow" para desarrollar aplicaciones inteligentes, debe crear una conexión a la implementación estándar. Para obtener información sobre cómo configurar una implementación estándar existente en una nueva área de trabajo o centro de conectividad, consulte Consuma implementaciones estándar desplegadas desde un área de trabajo diferente o desde Prompt Flow.
Sugerencia
Si usa el flujo de solicitud en la misma área de trabajo en la que se implementó la implementación, deberá crear la conexión.
Uso de la implementación estándar
Los modelos implementados en Azure Machine Learning y Microsoft Foundry en implementaciones estándar admiten la API de inferencia de modelos de Azure AI que expone un conjunto común de funcionalidades para los modelos fundamentales y que los desarrolladores pueden usar para consumir predicciones de un conjunto diverso de modelos de forma uniforme y coherente.
Obtenga más información sobre las Funcionalidades de esta API y cómo usarla al compilar aplicaciones.
Eliminación de puntos de conexión y suscripciones
Puede eliminar suscripciones y puntos de conexión del modelo. La eliminación de una suscripción modelo provoca que cualquier punto de conexión asociado se convierta en No saludable e inutilizable.
Para eliminar una implementación estándar:
Vaya a Azure Machine Learning Studio.
Seleccione Puntos de conexión en la barra lateral izquierda.
Seleccione la pestaña Puntos de conexión sin servidor para mostrar las implementaciones estándar.
Abra el punto de conexión que desea eliminar.
Seleccione Eliminar.
Para eliminar la suscripción del modelo asociado:
Vaya a Azure Portal.
Vaya al grupo de recursos al que pertenece el área de trabajo.
En el filtroTipo, seleccione SaaS.
Seleccione la suscripción que quiere eliminar.
Seleccione Eliminar.
Consideraciones de costo y cuota para los modelos implementados como implementaciones estándar
La cuota se gestiona por cada implementación. Cada implementación tiene un límite de velocidad de 200 000 tokens por minuto y 1000 solicitudes de API por minuto. Sin embargo, actualmente limitamos una implementación por modelo por área de trabajo. Póngase en contacto con el Soporte técnico de Microsoft Azure si los límites de velocidad actuales no son suficientes para sus escenarios.
Coste de los modelos de Microsoft
Puede encontrar la información de precios en la pestaña Precios y términos del Asistente para la implementación al implementar modelos de Microsoft (como modelos Phi-3) como implementaciones estándar.
Coste de los modelos que no son de Microsoft
Los modelos que no son de Microsoft implementados como implementaciones estándar se ofrecen a través de Azure Marketplace y se integran con Foundry para su uso. Puede encontrar precios de Azure Marketplace al implementar o ajustar estos modelos.
Cada vez que un área de trabajo se suscribe a una oferta determinada de Azure Marketplace, se crea un nuevo recurso para realizar un seguimiento de los costos asociados a su consumo. El mismo recurso se usa para hacer un seguimiento de los costos asociados con la inferencia y la optimización. Sin embargo, hay varios medidores disponibles para hacer un seguimiento de cada escenario de forma independiente.
Para más información sobre cómo realizar un seguimiento de los costos, consulte Supervisar los costos de los modelos ofrecidos a través de Azure Marketplace.
Permisos necesarios para suscribirse a ofertas de modelo
Los controles de acceso basado en rol de Azure (RBAC de Azure) se usan para conceder acceso a las operaciones en Azure Machine Learning. Para realizar los pasos descritos en este artículo, se debe asignar a la cuenta de usuario el rol de Propietario, Colaborador o Rol de desarrollador de Inteligencia artificial de Azure para la suscripción de Azure. Como alternativa, a la cuenta se le puede asignar un rol personalizado que tenga los permisos siguientes:
En la suscripción de Azure: para suscribir el área de trabajo a la oferta de Azure Marketplace, una vez para cada área de trabajo, por oferta:
Microsoft.MarketplaceOrdering/agreements/offers/plans/readMicrosoft.MarketplaceOrdering/agreements/offers/plans/sign/actionMicrosoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/readMicrosoft.Marketplace/offerTypes/publishers/offers/plans/agreements/readMicrosoft.SaaS/register/action
En el grupo de recursos, para crear y usar el recurso de SaaS:
Microsoft.SaaS/resources/readMicrosoft.SaaS/resources/write
En el área de trabajo—para implementar puntos de conexión (el rol científico de datos de Azure Machine Learning ya contiene estos permisos):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Para obtener más información sobre los permisos, consulte Administración del acceso a un área de trabajo de Azure Machine Learning.