Question 1

Qual opção de IA Windows devo usar?

Accepted Answer

Depende do hardware de destino e do caso de uso. APIs de IA do Windows oferecem o caminho mais simples para PCs Copilot+ — chamadas únicas de API para OCR, descrição de imagens, resumos de texto e chat com o Phi Silica, sem necessidade de gerenciar modelos. Foundry Local é a escolha certa quando você precisa de um catálogo de modelos mais amplo, suporte de hardware não Copilot+ PC ou acesso à API compatível com OpenAI. Windows ML oferece mais controle: traga qualquer modelo ONNX e gerencie provedores de execução diretamente. Consulte Como escolher sua solução de IA para Windows para ver uma comparação lado a lado.

Question 2

Preciso de um Copilot+ PC ou NPU para usar Windows recursos de IA?

Accepted Answer

Depende de qual recurso você está usando. Windows APIs de IA exigem um Copilot+ PC com uma NPU. O Foundry Local é executado em qualquer dispositivo Windows com uma GPU compatível com DirectX 12, incluindo dispositivos sem uma NPU. Windows ML dá suporte a uma ampla gama de CPUs, GPUs e NPUs. Consulte a lista de hardware com suporte para obter detalhes.

Question 3

Posso usar o Foundry Local com meu código do SDK openai existente?

Accepted Answer

Sim. O Foundry Local expõe uma API REST compatível com OpenAI. Inicie o serviço local com foundry service start, em seguida, aponte seu cliente OpenAI para o ponto de extremidade local – o nome do modelo, as mensagens e as chamadas de streaming funcionam sem alterações. Consulte Primeiros passos com o Foundry Local para ver o formato do endpoint.

Question 4

O Foundry Local é adequado para aplicativos de produção ou ainda é experimental?

Accepted Answer

Os SDKs nativos (C#, Python, JavaScript, Rust) estão atualmente em versão alfa/pré-lançamento. O ONNX Runtime e a infraestrutura subjacente de disponibilização de modelos estão prontos para produção. Para publicar aplicativos hoje, trate a superfície da API do SDK como algo sujeito a mudanças e fixe as versões dos seus pacotes. Consulte o que é o Foundry Local para obter o status de estabilidade mais recente.

Question 5

O Foundry Local funciona offline?

Accepted Answer

Sim, depois que um modelo é baixado e armazenado em cache no dispositivo, o Foundry Local executa inferência inteiramente no dispositivo sem dependência de nuvem. O download do modelo inicial requer acesso à Internet. Na inicialização, o Foundry Local pode tentar atualizar o catálogo de modelos, mas isso não é necessário – se o dispositivo estiver offline, ele retornará ao catálogo armazenado em cache e a inferência continuará normalmente. O método IsCachedAsync (C#) / is_cached (Python) do SDK permite que você verifique a disponibilidade do modelo antes de executar a inferência, para que possa lidar com o caso offline de forma adequada.

Question 6

Como o Foundry Local lida com diferenças de hardware entre dispositivos?

Accepted Answer

O Foundry Local detecta o hardware disponível na inicialização e seleciona o melhor provedor de execução – Qualcomm NPU (QNN), qualquer GPU compatível com DirectX 12 via WinML/DirectML (AMD, Intel, NVIDIA, Qualcomm), GPU NVIDIA via CUDA ou fallback de CPU. Você solicita um modelo por alias (por exemplo) phi-3.5-minie o Foundry Local atende automaticamente à variante com otimização de hardware para o dispositivo. O código do aplicativo é o mesmo em todas as configurações de hardware.

Question 7

O Foundry Local envia dados do usuário para a nuvem?

Accepted Answer

Não. O Foundry Local é executado inteiramente no dispositivo. A entrada e a saída de inferência nunca saem do computador. O único tráfego de rede é o download do modelo inicial e as atualizações de metadados de catálogo opcionais. Na inicialização, o Foundry Local pode tentar atualizar o catálogo de modelos, mas isso não é necessário – se o dispositivo estiver offline, ele retornará ao catálogo armazenado em cache e a inferência continuará normalmente.

Question 8

Como devo lidar com a privacidade de dados ao usar APIs de IA Windows?

Accepted Answer

Windows APIs de IA processam dados localmente no dispositivo usando a NPU. Os dados de entrada não são enviados para servidores Microsoft. Para obter diretrizes sobre práticas de IA responsáveis, consentimento e transparência, consulte Desenvolvendo aplicativos e recursos de IA generativos responsáveis em Windows.

Question 9

O que é Windows ML?

Accepted Answer

Windows ML permite que seu aplicativo use um ONNX Runtime compartilhado pelo sistema e baixe dinamicamente provedores de execução (EPs) específicos do fabricante, de modo que a inferência do modelo seja otimizada para a CPU, GPU ou NPU do dispositivo, sem que seu aplicativo precise incluir grandes binários de runtime ou de EP. Use-o quando precisar trazer seu próprio modelo ONNX ou desejar controle total sobre a seleção de EP. Consulte a visão geral do Windows ML.

Question 10

O que é DirectML?

Accepted Answer

O DirectML é uma API de aceleração de GPU de baixo nível para aprendizado de máquina, criada no Direct3D 12. Ele dá suporte a todas as GPUs compatíveis com DirectX 12 da AMD, Intel, NVIDIA e Qualcomm. O ONNX Runtime usa o DirectML como um provedor de execução no Windows quando o CUDA não está disponível.

Question 11

Qual é a diferença entre foundry-local-sdk e foundry-local-sdk-winml no PyPI?

Accepted Answer

foundry-local-sdk-winml é o pacote específico do Windows — ele inclui aceleração de hardware por meio do Windows ML e é recomendado no Windows. foundry-local-sdké o pacote multiplataforma para macOS, Linux ou Windows sem aceleração de hardware. Instale apenas um: os dois pacotes fixam versões onnxruntime-core diferentes e entrarão em conflito se ambos estiverem instalados. Observe que foundry-local no PyPI (sem -sdk) é um pacote de terceiros não relacionado — instalar foundry-local-sdk ou foundry-local-sdk-winml.

Question 12

Como posso verificar qual GPU ou NPU meu dispositivo tem?

Accepted Answer

Abra o Gerenciador de Tarefas (Ctrl+Shift+Esc), selecione a guia Desempenho e procure entradas de GPU e NPU no painel esquerdo. Você também pode executar foundry model list na linha de comando — o Foundry Local exibirá quais provedores de execução estão ativos para seu hardware quando ele iniciar o serviço.

Escolhendo a opção certa

Qual opção de IA Windows devo usar?

Preciso de um Copilot+ PC ou NPU para usar Windows recursos de IA?

Posso usar o Foundry Local com meu código do SDK openai existente?

O Foundry Local é adequado para aplicativos de produção ou ainda é experimental?

O Foundry Local funciona offline?

Como o Foundry Local lida com diferenças de hardware entre dispositivos?

Privacidade e segurança de dados

O Foundry Local envia dados do usuário para a nuvem?

Como devo lidar com a privacidade de dados ao usar APIs de IA Windows?

Plataforma e tempo de execução

O que é Windows ML?

O que é DirectML?

Qual é a diferença entre foundry-local-sdk e foundry-local-sdk-winml no PyPI?

Como posso verificar qual GPU ou NPU meu dispositivo tem?

Perguntas frequentes sobre como usar IA em aplicativos Windows

Escolhendo a opção certa

Qual opção de IA Windows devo usar?

Preciso de um Copilot+ PC ou NPU para usar Windows recursos de IA?

Posso usar o Foundry Local com meu código do SDK openai existente?

O Foundry Local é adequado para aplicativos de produção ou ainda é experimental?

O Foundry Local funciona offline?

Como o Foundry Local lida com diferenças de hardware entre dispositivos?

Privacidade e segurança de dados

O Foundry Local envia dados do usuário para a nuvem?

Como devo lidar com a privacidade de dados ao usar APIs de IA Windows?

Plataforma e tempo de execução

O que é Windows ML?

O que é DirectML?

Qual é a diferença entre foundry-local-sdk e foundry-local-sdk-winml no PyPI?

Como posso verificar qual GPU ou NPU meu dispositivo tem?

Comentários

Recursos adicionais