Partilhar via


Consumir pontos de extremidade de API sem servidor de um projeto ou hub diferente do Estúdio de IA do Azure

Neste artigo, você aprenderá a configurar um ponto de extremidade de API sem servidor existente em um projeto ou hub diferente daquele que foi usado para criar a implantação.

Alguns modelos no catálogo de modelos podem ser implantados como APIs sem servidor. Esse tipo de implantação oferece uma forma de consumir os modelos como uma API sem hospedá-los na sua assinatura, mantendo a segurança e a conformidade corporativa de que as organizações precisam. Essa opção de implantação não requer cota de sua assinatura.

A necessidade de consumir um ponto de extremidade de API sem servidor em um projeto ou hub diferente daquele usado para criar a implantação pode surgir em situações como:

  • Você deseja centralizar suas implantações em um determinado projeto ou hub e consumi-las a partir de diferentes projetos ou hubs em sua organização.
  • Você precisa implantar um modelo em um hub em uma região específica do Azure onde a implantação sem servidor para esse modelo esteja disponível. No entanto, você precisa consumi-lo de outra região, onde a implantação sem servidor não está disponível para os modelos em questão.

Pré-requisitos

Criar uma conexão de ponto de extremidade de API sem servidor

Execute estas etapas para criar uma conexão:

  1. Conecte-se ao projeto ou hub em que o ponto de extremidade está implantado:

    Acesse o Estúdio de IA do Azure e navegue até o projeto no qual o ponto de extremidade ao qual você deseja se conectar está implantado.

  2. Obtenha a URL do ponto de extremidade e as credenciais do ponto de extremidade ao qual você deseja se conectar. Neste exemplo, você obtém os detalhes de um nome de ponto de extremidade meta-llama3-8b-qwerty.

    1. Na barra lateral esquerda do seu projeto no Estúdio de IA, acesse Componentes>Implantações para ver a lista de implantações no projeto.

    2. Selecione a implantação à qual você deseja se conectar.

    3. Copie os valores para o URI de destino e a Chave.

  3. Agora, conecte-se ao projeto ou hub em que você deseja criar a conexão:

    Acesse o projeto para o qual a conexão precisa ser criada.

  4. Crie a conexão no projeto:

    1. Na barra lateral esquerda do projeto no Estúdio de IA, selecione Configurações.

    2. Na seção Recursos conectados, selecione Nova conexão.

    3. Selecione Modelo sem servidor.

    4. Para o URI de Destino, cole o valor que você copiou anteriormente.

    5. Faça o mesmo para a Chave e cole o valor copiado.

    6. Dê um nome para a conexão, nesse caso, meta-llama3-8b-connection.

    7. Selecione Adicionar conexão.

  5. Neste ponto, a conexão está pronta para consumo.

  6. Para validar se a conexão está funcionando:

    1. Na barra lateral esquerda do projeto no Estúdio de IA, acesse Ferramentas>Prompt flow.

    2. Selecione Criar para criar um novo fluxo.

    3. Selecione Criar na caixa Fluxo de chat.

    4. Dê um nome para o seu Prompt flow e selecione Criar.

    5. Selecione o nó chat no gráfico para acessar a seção chat.

    6. Em Conexão, abra a lista de seleção e selecione a conexão que você acabou de criar, nesse caso meta-llama3-8b-connection.

    7. Selecione Iniciar sessão de computação na barra de navegação superior para começar um runtime automático de prompt flow.

    8. Selecione a opção Chat. Agora você pode enviar mensagens e receber respostas.