Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Neste artigo, você aprenderá a implantar um modelo do catálogo de modelos como uma implantação padrão.
Determinados modelos no catálogo de modelos podem ser implementados como uma implementação padrão com cobrança padrão. Esse tipo de implantação fornece uma maneira de consumir modelos como uma API sem hospedá-los em sua assinatura, mantendo a segurança e a conformidade corporativas de que as organizações precisam. Essa opção de implantação não exige cota da sua assinatura.
Este artigo usa uma implantação do modelo Meta Llama para ilustração. No entanto, você pode usar as mesmas etapas para implantar qualquer um dos modelos no catálogo de modelos que estão disponíveis para implantação padrão.
Pré-requisitos
Uma subscrição do Azure com um método de pagamento válido. As subscrições gratuitas ou de avaliação do Azure não funcionarão. Se você não tiver uma assinatura do Azure, crie uma conta paga do Azure para começar.
Um espaço de trabalho do Azure Machine Learning.
Os controlos de acesso baseado em funções (RBAC do Azure) são utilizados para conceder acesso às operações no Azure Machine Learning. Para executar as etapas neste artigo, sua conta de usuário deve receber a função de Desenvolvedor do Azure AI no grupo de recursos. Para obter mais informações sobre permissões, consulte Controle de acesso baseado em função no Azure Machine Learning.
Você precisa instalar o seguinte software para trabalhar com o Azure Machine Learning:
- Estúdio
- Azure CLI
- Python SDK
- BRAÇO
Você pode usar qualquer navegador da Web compatível para navegar no Azure Machine Learning.
Encontre o seu modelo e ID de modelo no catálogo de modelos
Entrar no estúdio do Azure Machine Learning
Para modelos oferecidos através do Azure Marketplace, certifique-se de que a sua conta tem as permissões de função de Programador de IA do Azure no grupo de recursos ou que cumpre as permissões necessárias para subscrever ofertas de modelos.
Os modelos oferecidos por fornecedores que não são da Microsoft (por exemplo, modelos Llama e Mistral) são faturados através do Azure Marketplace. Para esses modelos, é necessário inscrever seu espaço de trabalho na oferta de modelo específica. Os modelos oferecidos pela Microsoft (por exemplo, modelos Phi-3) não têm esse requisito, pois a cobrança é feita de forma diferente. Para detalhes da cobrança pela implementação sem servidor de modelos no catálogo de modelos, consulte Cobrança de implementações padrão.
Vá para o seu espaço de trabalho. Para usar a oferta de implantação padrão, seu espaço de trabalho deve pertencer a uma das regiões com suporte para implantação sem servidor para o modelo específico que você deseja implantar.
Selecione Catálogo de modelos na barra lateral esquerda e localize o cartão de modelo do modelo que você deseja implantar. Neste artigo, você seleciona um modelo Bria-2.3-Fast .
- Se você estiver implantando o modelo usando a CLI do Azure, Python SDK ou ARM, copie a ID do modelo.
Importante
Não inclua a versão ao copiar a ID do modelo. As implantações padrão sempre implantam a versão mais recente disponível do modelo. Por exemplo, para o ID
azureml://registries/azureml-bria/models/Bria-2.3-Fast/versions/1do modelo , copieazureml://registries/azureml-bria/models/Bria-2.3-Fast.
A próxima seção aborda as etapas para inscrever seu espaço de trabalho em uma oferta de modelo. Você pode pular esta seção e ir para Implantar o modelo em uma implantação padrão, se estiver implantando um modelo da Microsoft.
Inscreva seu espaço de trabalho na oferta de modelo
As implantações padrão podem implementar modelos oferecidos pela Microsoft e de outras marcas. Para modelos da Microsoft (como modelos Phi-3), você não precisa criar uma assinatura do Azure Marketplace e pode implantá-los em implantações padrão diretamente para consumir suas previsões. Para modelos que não sejam da Microsoft, você precisa criar a assinatura primeiro. Se for a primeira vez que implementa o modelo na área de trabalho, tem de subscrever a sua área de trabalho para a oferta de modelo específica do Azure Marketplace. Cada espaço de trabalho tem sua própria assinatura para a oferta específica do Azure Marketplace do modelo, que permite controlar e monitorar os gastos.
Observação
Os modelos oferecidos pelo Azure Marketplace estão disponíveis para implantação em implantações padrão em regiões específicas. Verifique a disponibilidade da região para modelos em implantações padrão para verificar quais modelos e regiões estão disponíveis. Se o que você precisa não estiver listado, você poderá implantar em um espaço de trabalho em uma região com suporte e, em seguida, consumir implantações padrão de um espaço de trabalho diferente.
Crie a assinatura do marketplace do modelo. Ao criar uma assinatura, você aceita os termos e condições associados à oferta modelo. Lembre-se de que você não precisa executar esta etapa para modelos oferecidos pela Microsoft (como o Phi-3).
- Estúdio
- Azure CLI
- Python SDK
- BRAÇO
Na página Detalhes do modelo, selecione Usar este modelo. Uma janela Opções de implantação é aberta, oferecendo a você a opção entre implantação padrão (API sem servidor) e implantação usando uma computação gerenciada.
Observação
Para modelos que podem ser implantados somente por meio da implantação padrão, o assistente de implantação padrão é aberto logo após você selecionar Usar este modelo na página de detalhes do modelo.
Selecione Serverless API para abrir o assistente de implantação padrão.
Se vir a nota Já tem uma subscrição do Azure Marketplace para esta área de trabalho, não precisa de criar a subscrição, uma vez que já tem uma. Você pode prosseguir para Implantar o modelo em uma implantação padrão.
No assistente de implantação, selecione o link para Termos do Azure Marketplace para saber mais sobre os termos de uso. Você também pode selecionar a guia Preços e termos para saber mais sobre os preços do modelo selecionado.
No assistente de implantação, selecione o link para os Termos do Azure Marketplace para saber mais sobre os termos de uso. Você também pode selecionar a guia Detalhes da oferta do Marketplace para saber mais sobre os preços do modelo selecionado.
Selecione Subscrever e Implantar.
Depois de inscrever o espaço de trabalho para a oferta específica do Azure Marketplace, as implantações subsequentes da mesma oferta no mesmo espaço de trabalho não exigem assinatura novamente.
A qualquer momento, você pode ver as ofertas de modelo às quais seu espaço de trabalho está inscrito no momento:
- Estúdio
- Azure CLI
- Python SDK
- BRAÇO
Vá para o portal do Azure
Navegue até o grupo de recursos ao qual o espaço de trabalho pertence.
No filtro Tipo, selecione SaaS.
Você vê todas as ofertas às quais está inscrito no momento.
Selecione qualquer recurso para ver os detalhes.
Implantar o modelo numa implantação padrão
Depois de criar uma assinatura para um modelo que não seja da Microsoft, você pode implantar o modelo associado em uma implantação padrão. Para modelos Microsoft (como modelos Phi-3), não é necessário criar uma assinatura.
A implantação padrão fornece uma maneira de consumir modelos como uma API sem hospedá-los em sua assinatura, mantendo a segurança corporativa e a conformidade de que as organizações precisam. Essa opção de implantação não exige cota da sua assinatura.
Nesta seção, você cria um ponto de extremidade com o nome Bria-2.3-Fast.
Crie o ponto de extremidade sem servidor
- Estúdio
- Azure CLI
- Python SDK
- BRAÇO
Para implantar um modelo da Microsoft que não exija a assinatura de uma oferta de modelo, selecione Usar este modelo e, em seguida, selecione API sem servidor para abrir o assistente de implantação.
Como alternativa, para um modelo que não seja da Microsoft que exija uma assinatura de modelo, se você tiver inscrito seu espaço de trabalho na oferta de modelo na seção anterior, continue a selecionar Implantar. Como alternativa, selecione Continuar a implantar (se o assistente de implantação tiver a observação Você já tem uma assinatura do Azure Marketplace para este espaço de trabalho).
Dê um nome à implantação. Esse nome se torna parte da URL da API de implantação. Essa URL deve ser exclusiva em cada região do Azure.
Sugestão
A opção Filtro de conteúdo (visualização) está ativada por padrão. Deixe a configuração padrão para o serviço detetar conteúdo nocivo, como conteúdo de ódio, automutilação, sexual e violento. Para obter mais informações sobre filtragem de conteúdo (pré-visualização), consulte Segurança de conteúdo para modelos desenvolvidos por meio de implantações padrão.
Selecione Implantar. Aguarde até que a implantação esteja pronta e você seja redirecionado para a página Implantações.
A qualquer momento, podes ver as interfaces implantadas no teu espaço de trabalho.
- Estúdio
- Azure CLI
- Python SDK
- BRAÇO
Vá para o seu espaço de trabalho.
Selecione Pontos finais.
Selecione a guia Endpoints sem servidor para exibir as implantações padrão.
O ponto de extremidade criado usa autenticação de chave para autorização. Utilize os passos seguintes para obter as chaves associadas a um dado endpoint.
- Estúdio
- Azure CLI
- Python SDK
- BRAÇO
- Para retornar à página da implementação, selecione o nome do endpoint na lista de endpoints sem servidor.
- Observe o URI de destino e a chave do ponto de extremidade. Utilize-os para chamar a implementação e gerar predições.
Observação
Ao usar o portal do Azure, as implantações padrão não são exibidas por padrão no grupo de recursos. Use a opção Mostrar tipos ocultos para exibi-los no grupo de recursos.
Neste ponto, seu endpoint está pronto para ser usado.
Caso necessite consumir essa implantação a partir de um espaço de trabalho diferente ou pretenda usar o fluxo de prompts para desenvolver aplicações inteligentes, deverá estabelecer uma ligação à implantação padrão. Para saber como configurar uma implantação padrão existente em um novo espaço de trabalho ou hub, veja Consumir implantações padrão de um espaço de trabalho diferente ou do Prompt flow.
Sugestão
Caso estejas a usar o prompt flow no mesmo espaço de trabalho onde a implantação foi realizada, ainda assim necessitarás criar a ligação.
Utilizar a implantação padrão
Modelos implementados no Azure Machine Learning e Microsoft Foundry em implementações padrão suportam a API Azure AI Model Inference , que expõe um conjunto comum de capacidades para modelos fundamentais e que podem ser usados pelos programadores para consumir previsões de um conjunto diversificado de modelos de forma uniforme e consistente.
Leia mais sobre os recursos dessa API e como você pode usá-la ao criar aplicativos.
Excluir pontos de extremidade e assinaturas
Você pode excluir assinaturas de modelo e pontos de extremidade. A exclusão de uma assinatura de modelo faz com que qualquer ponto de extremidade associado se torne não íntegro e inutilizável.
- Estúdio
- Azure CLI
- Python SDK
- BRAÇO
Para excluir uma implantação padrão:
Vá para o estúdio do Azure Machine Learning.
Selecione Pontos de extremidade na barra lateral esquerda.
Selecione a guia Endpoints sem servidor para exibir as implantações padrão.
Abra o ponto de extremidade que você deseja excluir.
Selecione Eliminar.
Para excluir a assinatura de modelo associada:
Vá para o portal do Azure
Navegue até o grupo de recursos ao qual o espaço de trabalho pertence.
No filtro Tipo, selecione SaaS.
Selecione a subscrição que quer eliminar.
Selecione Eliminar.
Considerações sobre custo e cota para modelos implantados como implantações padrão
A quota é gerida por cada implementação. Cada implementação tem um limite de taxa de 200 000 tokens por minuto e 1000 pedidos de API por minuto. No entanto, atualmente, limitamos uma implementação por modelo por área de trabalho. Contacte o Suporte do Microsoft Azure se os limites de taxa atuais não forem suficientes para os seus cenários.
Custo para modelos Microsoft
Você pode encontrar as informações de preços na guia Preços e termos do assistente de implantação ao implantar modelos da Microsoft (como modelos Phi-3) como implantações padrão.
Custo para modelos que não sejam da Microsoft
Modelos não Microsoft implementados como implementações padrão são oferecidos através do Azure Marketplace e integrados com o Foundry para uso. Você pode encontrar os preços do Azure Marketplace ao implantar ou ajustar esses modelos.
Sempre que uma área de trabalho subscreve uma determinada oferta do Azure Marketplace, é criado um novo recurso para controlar os custos associados ao seu consumo. O mesmo recurso é usado para monitorizar os custos associados à inferência e à otimização; no entanto, estão disponíveis vários medidores para monitorizar cada cenário de forma independente.
Para obter mais informações sobre como controlar custos, consulte Monitorar custos para modelos oferecidos por meio do Azure Marketplace.
Permissões necessárias para subscrever ofertas de modelos
Os controlos de acesso baseado em funções (RBAC do Azure) são utilizados para conceder acesso às operações no Azure Machine Learning. Para executar as etapas neste artigo, sua conta de usuário deve receber a função de Proprietário, Colaborador ou Desenvolvedor do Azure AI para a assinatura do Azure. Em alternativa, pode ser atribuída à sua conta uma função personalizada com as seguintes permissões:
Na assinatura do Azure — para inscrever o espaço de trabalho na oferta do Azure Marketplace, uma vez para cada espaço de trabalho, por oferta:
Microsoft.MarketplaceOrdering/agreements/offers/plans/readMicrosoft.MarketplaceOrdering/agreements/offers/plans/sign/actionMicrosoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/readMicrosoft.Marketplace/offerTypes/publishers/offers/plans/agreements/readMicrosoft.SaaS/register/action
No grupo de recursos — para criar e utilizar o recurso SaaS:
Microsoft.SaaS/resources/readMicrosoft.SaaS/resources/write
No espaço de trabalho — para implementar pontos finais (a função de cientista de dados do Azure Machine Learning já contém essas permissões):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Para obter mais informações sobre permissões, consulte Gerir o acesso a um espaço de trabalho do Azure Machine Learning.