Partilhar via


Configurar o ambiente

Importante

O tempo de execução da IA para tarefas de nó único está em Pré-visualização Pública. A API de treino distribuída para cargas de trabalho multi-GPU permanece em Beta.

Esta página descreve como escolher e configurar um ambiente Python para o tempo de execução de IA, incluindo comportamento de cache do ambiente, importações personalizadas de módulos e limitações conhecidas.

Que ambiente usar

O AI Runtime oferece dois ambientes Python geridos, o ambiente base predefinido e o ambiente de IA Databricks.

Ambiente Características principais Quando utilizar
Ambiente base predefinido Minimal, inclui apenas torch, cuda, e torchvision Quer ter controlo total sobre a sua estrutura de dependências e prefere instalar apenas o estritamente necessário.
Ambiente de IA da Databricks Pré-carregado com frameworks de ML populares (PyTorch, Transformers e mais) Queres um ambiente completo para treino, ajustes finos e experimentação sem gestão manual de dependências

Observação

Os ambientes base do espaço de trabalho não são suportados para IA Runtime. Em vez disso, use o ambiente padrão ou o de inteligência artificial e especifique dependências adicionais diretamente no painel lateral dos Ambientes ou pip install neles.

Ambiente base padrão (ambiente mínimo)

Um ambiente mínimo e estável contendo apenas os pacotes necessários para a operação em tempo de execução da IA. O ambiente inclui torch, cuda, e torchvision, otimizado para compatibilidade. Para versões específicas dos pacotes, use pip install ou fixe as versões necessárias conforme necessário.

Ideal para: Utilizadores que querem controlo total sobre a sua pilha de dependências e preferem instalar apenas o que precisam.

Este é o ambiente padrão quando se liga a uma GPU serverless via AI Runtime.

Para mais detalhes sobre as versões dos pacotes instaladas em diferentes versões, consulte as notas de lançamento:

Ambiente de IA Databricks

Disponível no ambiente 4 e posteriores. O ambiente de IA é construído sobre o ambiente base predefinido, com pacotes de execução comuns e específicos para aprendizagem automática em GPUs. Os pacotes pré-instalados incluem:

  • PyTorch (com suporte CUDA)
  • Transformers (Hugging Face)
  • E também as dependências adicionais de ML/DL

Ideal para: profissionais de ML que querem um ambiente completo para treinar cargas de trabalho, ajustes finos e experimentação sem gestão manual de dependências.

Para selecionar: No painel lateral de Ambiente , escolha AI v4 como ambiente base.

Para mais detalhes sobre as versões dos pacotes instaladas em diferentes versões, consulte as notas de lançamento:

Ambientes base de trabalho

Os ambientes base do espaço de trabalho não são suportados para AI Runtime. Não pode usar configurações personalizadas de ambiente ao nível do espaço de trabalho.

Para configurar o seu ambiente de deep learning para um projeto, use um dos dois ambientes base fornecidos (default ou Databricks AI) e instale pacotes adicionais programaticamente usando %pip install dentro do seu notebook ou no topo do seu script de treino:

%pip install datasets accelerate peft bitsandbytes

Pode instalar bibliotecas adicionais no ambiente de Runtime de IA. Consulte Adicionar dependências ao notebook.

Comportamento

Quando é que os ambientes são armazenados em cache?

Os ambientes são armazenados em cache entre sessões para acelerar os tempos de arranque. Quando se reconecta ao AI Runtime com a mesma configuração de ambiente, os pacotes previamente instalados podem estar disponíveis a partir da cache, reduzindo o tempo de configuração.

No entanto, o comportamento da cache não é garantido — certifique-se sempre de que o seu caderno inclui os comandos necessários %pip install para a reprodutibilidade.

Como importo módulos personalizados?

Pode importar módulos personalizados colocando-os em /Workspace/Shared e depois adicionar o caminho em sys.path:

import sys
sys.path.append("/Workspace/Shared/my-project/src")
from my_module import my_function

Também pode carregar ficheiros de módulos como ficheiros Workspace e importá-los diretamente. Para colaboração entre multiutilizadores, armazene o código partilhado em /Workspace/Shared em vez de pastas específicas de cada utilizador. Para desenvolvimento ativo, use pastas específicas de utilizador e envie para um repositório Git remoto para controlo de versões.

Limitações

As seguintes capacidades não estão disponíveis no AI Runtime:

  • Funções Spark — Não pode importar nem usar funções PySpark diretamente. O AI Runtime é um ambiente exclusivo de Python; O Spark não está disponível como tempo de execução local. No entanto, o Spark Connect está disponível para carregamento de dados. Consulte os dados de carregamento do tempo de execução de IA.
  • Bibliotecas do Databricks Runtime ML — Os pacotes pré-instalados não são uma substituição para as bibliotecas do Databricks Runtime ML. Algumas bibliotecas de ML disponíveis no Databricks Runtime ML podem não estar pré-instaladas no AI Runtime.
  • Ambientes base de espaço de trabalho — Configurações personalizadas ao nível do ambiente de trabalho não são suportadas.
  • Artefactos privados — O AI Runtime suporta artefactos privados em certos casos. Contacte a sua equipa de contas para mais detalhes.