Partilhar via


Consumir pontos de extremidade de API sem servidor de um espaço de trabalho diferente

Neste artigo, você aprenderá a configurar um ponto de extremidade de API sem servidor existente em um espaço de trabalho diferente daquele em que ele foi implantado.

Certos modelos no catálogo de modelos podem ser implantados como APIs sem servidor. Esse tipo de implantação fornece uma maneira de consumir modelos como uma API sem hospedá-los em sua assinatura, mantendo a segurança e a conformidade corporativas de que as organizações precisam. Essa opção de implantação não exige cota da sua assinatura.

A necessidade de consumir um ponto de extremidade de API sem servidor em um espaço de trabalho diferente daquele que foi usado para criar a implantação pode surgir em situações como estas:

  • Você deseja centralizar suas implantações em um determinado espaço de trabalho e consumi-las de diferentes espaços de trabalho em sua organização.
  • Você precisa implantar um modelo em um espaço de trabalho em uma região específica do Azure onde a implantação sem servidor para esse modelo está disponível. No entanto, você precisa consumi-lo de outra região, onde a implantação sem servidor não está disponível para os modelos específicos.

Pré-requisitos

  • Uma subscrição do Azure com um método de pagamento válido. As subscrições gratuitas ou de avaliação do Azure não funcionarão. Se você não tiver uma assinatura do Azure, crie uma conta paga do Azure para começar.

  • Um espaço de trabalho do Azure Machine Learning onde você deseja consumir a implantação existente.

  • Um modelo implantado em um ponto de extremidade de API sem servidor. Este artigo pressupõe que você implantou anteriormente o modelo Meta-Llama-3-8B-Instruct . Para saber como implantar esse modelo como uma API sem servidor, consulte Implantar modelos como APIs sem servidor.

  • Você precisa instalar o seguinte software para trabalhar com o Azure Machine Learning:

    Você pode usar qualquer navegador da Web compatível para navegar no estúdio do Azure Machine Learning.

Criar uma conexão de ponto de extremidade de API sem servidor

Siga estas etapas para criar uma conexão:

  1. Conecte-se ao espaço de trabalho onde o ponto de extremidade é implantado:

    Vá para o estúdio do Azure Machine Learning e navegue até o espaço de trabalho onde o ponto de extremidade ao qual você deseja se conectar está implantado.

  2. Obtenha a URL e as credenciais do ponto de extremidade para o ponto de extremidade ao qual você deseja se conectar. Neste exemplo, você obtém os detalhes de um nome de ponto final meta-llama3-8b-qwerty.

    1. Selecione Pontos de extremidade na barra lateral esquerda.

    2. Selecione a guia Pontos de extremidade sem servidor para exibir os pontos de extremidade da API sem servidor.

    3. Selecione o ponto de extremidade ao qual você deseja se conectar.

    4. Na guia Detalhes do ponto de extremidade, copie os valores para URI de destino e Chave.

  3. Agora, conecte-se ao espaço de trabalho onde você deseja criar a conexão e consuma o ponto de extremidade.

  4. Crie a conexão no espaço de trabalho:

    1. Vá para o espaço de trabalho onde a conexão precisa ser criada.

    2. Vá para a seção Gerenciar na barra de navegação esquerda e selecione Conexões.

    3. Selecione Criar.

    4. Selecione Modelo sem servidor.

    5. Para o URI de destino, cole o valor copiado anteriormente.

    6. Para a chave, cole o valor copiado anteriormente.

    7. Dê um nome à conexão, neste caso meta-llama3-8b-connection.

    8. Selecione Adicionar ligação.

  5. Neste ponto, a conexão está disponível para consumo.

  6. Para validar se a conexão está funcionando:

    1. Na barra de navegação esquerda do estúdio do Azure Machine Learning, vá para o fluxo do Prompt de>Criação.

    2. Selecione Criar para criar um novo fluxo.

    3. Selecione Criar na caixa Fluxo de chat.

    4. Dê um nome ao fluxo de prompt e selecione Criar.

    5. Selecione o nó de bate-papo no gráfico para ir para a seção de bate-papo.

    6. Para Conexão, abra a lista suspensa para selecionar a conexão que você acabou de criar, neste caso meta-llama3-8b-connection.

    7. Selecione Iniciar sessão de computação na barra de navegação superior para iniciar um tempo de execução automático de fluxo de prompt.

    8. Selecione a opção Chat . Agora você pode enviar mensagens e obter respostas.