Partilhar via


Importar a partir da Base de Dados SQL do Azure

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Este artigo descreve como usar o módulo de Dados de Importação em Machine Learning Studio (clássico), para obter dados de um Base de Dados SQL do Azure ou Azure SQL Data Warehouse.

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Para importar dados de uma base de dados, deve especificar o nome do servidor e o nome da base de dados, e uma declaração SQL que define a tabela, visualização ou consulta.

Em geral, armazenar dados em bases de dados Azure é mais caro do que usar tabelas ou bolhas em Azure. Pode também haver limites na quantidade de dados que pode armazenar numa base de dados, dependendo do seu tipo de subscrição. No entanto, não existem taxas de transação contra SQL Azure Database, pelo que essa opção é ideal para o acesso rápido a quantidades menores de informação frequentemente utilizada, como tabelas de procura de dados ou dicionários de dados.

É também preferível armazenar dados numa base de dados Azure se precisar de ser capaz de filtrar dados antes de os ler, ou se pretender guardar previsões ou métricas de volta à base de dados para reportar.

Como importar dados de Base de Dados SQL do Azure ou SQL Data Warehouse

Utilize o assistente de importação de dados

O módulo apresenta um novo assistente para o ajudar a escolher uma opção de armazenamento, selecionar entre as subscrições e contas existentes e configurar rapidamente todas as opções.

  1. Adicione o módulo de Dados de Importação à sua experiência. Pode encontrar o módulo em Estúdio (clássico), na categoria Entrada e Saída de Dados .

  2. Clique em Lançar Assistente de Dados de Importação e siga as instruções.

  3. Quando a configuração estiver concluída, para copiar os dados na sua experiência, clique com o botão direito no módulo e selecione Executar Selecionado.

Se precisar de editar uma ligação de dados existente, o assistente carrega todos os detalhes de configuração anteriores para que não tenha de recomeçar do zero

Definir manualmente propriedades no módulo de dados de importação

Os seguintes passos descrevem como configurar manualmente a fonte de importação.

  1. Adicione o módulo de Dados de Importação à sua experiência. Pode encontrar este módulo em Studio (clássico), na categoria Entrada e Saída de Dados .

  2. Para obter a fonte de dados, selecione Base de Dados SQL do Azure.

  3. Desconfie das seguintes opções específicas para Base de Dados SQL do Azure ou Azure SQL Data Warehouse.

    Nome do servidor da base de dados: Digite o nome do servidor que é gerado pelo Azure. Tipicamente tem o formulário <generated_identifier>.database.windows.net.

    Nome da base de dados: Digite o nome de uma base de dados existente no servidor que acabou de especificar.

    Nome da conta do utilizador do servidor: Digite o nome de utilizador de uma conta que tenha permissões de acesso para a base de dados.

    Senha de conta de utilizador do servidor: Forneça a palavra-passe para a conta de utilizador especificada.

    Consulta de base de dados: Digite ou cole uma declaração SQL que descreve os dados que pretende ler. Valide sempre a declaração de SQL e verifique previamente os resultados da consulta, utilizando uma ferramenta como Visual Studio Server Explorer ou SQL Server Data Tools.

    Nota

    O módulo De Dados de Importação só suporta a introdução do nome da base de dados, o nome da conta do utilizador e a palavra-passe como credenciais.

  4. Se o conjunto de dados que leu Machine Learning não for esperado que altere entre as execuções da experiência, selecione a opção de resultados em cache Utilização.

    Quando este é selecionado, se não houver outras alterações nos parâmetros do módulo, a experiência carrega os dados na primeira vez que o módulo é executado, e depois utiliza uma versão em cache do conjunto de dados.

    Se pretender repor o conjunto de dados em cada iteração da experiência, desmarca esta opção. O conjunto de dados é recarregado a partir da fonte cada vez que quaisquer parâmetros são alterados em Dados de Importação.

  5. Execute a experimentação.

    À medida que os Dados de Importação carregam os dados em Studio (clássico), alguma conversão implícita do tipo também pode ser realizada, dependendo dos tipos de dados utilizados na base de dados de origem.

Resultados

Quando a importação estiver concluída, clique no conjunto de dados de saída e selecione Visualize para ver se os dados foram importados com sucesso.

Opcionalmente, pode alterar o conjunto de dados e os seus metadados utilizando as ferramentas em Studio (clássico):

Exemplos

Para um exemplo de como utilizar dados de bases de dados da Azure em machine learning, consulte estes artigos e experiências:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Perguntas comuns

Posso filtrar os dados como estão a ser lidos pela fonte?

O módulo De Dados de Importação não suporta a filtragem à medida que os dados estão a ser lidos. Recomendamos que crie uma vista ou defina uma consulta que gere apenas as linhas de que necessita.

Nota

Se descobrir que carregou mais dados do que o necessário, pode substituir o conjunto de dados em cache lendo um novo conjunto de dados e guardá-lo com o mesmo nome que os dados mais antigos e maiores.

Por que tenho o erro: "Tipo Decimal não é suportado"?

Ao ler dados de uma base de dados SQL, poderá encontrar uma mensagem de erro reportando um tipo de dados não suportado.

Se os dados que obtém da base de dados SQL incluir tipos de dados que não são suportados em Machine Learning, deverá lançar ou converter os decimais para um dado suportado antes de ler os dados. Os Dados de Importação não podem efetuar automaticamente quaisquer conversões que resultem numa perda de precisão.

Para obter mais informações sobre tipos de dados suportados, consulte os Tipos de Dados do Módulo.

O que acontece se a base de dados estiver numa região geográfica diferente. Os Dados de Importação ainda podem aceder à base de dados? Onde estão os dados armazenados?

Se a base de dados estiver numa região diferente da conta de machine learning, o acesso aos dados pode ser mais lento. Além disso, é cobrado por entrada de dados e saída na subscrição se o nó de computação estiver numa região diferente da conta de armazenamento.

Os dados que lê no seu espaço de trabalho para uma experiência são guardados na conta de armazenamento associada à experiência.

Porque é que alguns personagens não são exibidos corretamente?

Machine Learning apoia a codificação UTF-8. Se as colunas de cordas na sua base de dados utilizarem uma codificação diferente, os caracteres podem não ser importados corretamente.

Uma opção é exportar os dados para um ficheiro CSV no armazenamento Azure, e usar a opção CSV com codificação para especificar parâmetros para delimiters personalizados, a página de código, e assim por diante.

Parâmetros do módulo

Nome Intervalo Tipo Predefinição Description
Origem de dados Lista Fonte de dados ou pia Armazenamento de Blobs do Azure A fonte de dados pode ser HTTP, FTP, HTTPS anónimo ou FTPS, um ficheiro no armazenamento Azure BLOB, uma tabela Azure, uma Base de Dados SQL do Azure, uma base de dados SQL Server no local, uma tabela Hive ou um ponto final OData.
URI do servidor HDFS qualquer String nenhum Ponto final de descanso HDFS
Nome do servidor de base de dados qualquer String nenhum Nome da conta de armazenamento do Azure
Nome da base de dados qualquer SecureString nenhum Chave de armazenamento azul
Nome da conta do utilizador do servidor qualquer String nenhum Nome do recipiente Azure
Nome da conta do utilizador do servidor Lista (subconjunto) Conteúdo de url OData Tipo de formato de dados
Consulta de base de dados qualquer String nenhum Tipo de formato de dados
Use resultados em cache VERDADEIRO/FALSO Booleano FALSE descrição

Saídas

Nome Tipo Description
Conjunto de dados de resultados Tabela de Dados Dataset com dados descarregados

Exceções

Exceção Description
Erro 0027 Uma exceção ocorre quando dois objetos têm que ter o mesmo tamanho, mas não são.
Erro 0003 Uma exceção ocorre se uma ou mais entradas forem nulas ou vazias.
Erro 0029 Uma exceção ocorre quando um URI inválido é passado.
Erro 0030 uma exceção ocorre quando não é possível descarregar um ficheiro.
Erro 0002 Ocorre uma exceção se um ou mais parâmetros não puderem ser analisados ou convertidos do tipo especificado para o tipo exigido pelo método-alvo.
Erro 0009 Ocorre uma exceção se o nome da conta de armazenamento Azure ou o nome do recipiente forem especificados incorretamente.
Erro 0048 Uma exceção ocorre quando não é possível abrir um ficheiro.
Erro 0015 Uma exceção ocorre se a ligação da base de dados tiver falhado.
Erro 0046 Uma exceção ocorre quando não é possível criar um diretório em caminho especificado.
Erro 0049 Uma exceção ocorre quando não é possível analisar um ficheiro.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.

Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.

Ver também

Importar Dados
Dados de Exportação
Importar a partir do URL da Web através de HTTP
Importação da Consulta de Colmeia
Importação da Tabela Azure
Importação de Azure Blob Armazenamento
Importação de Fornecedores de Feed de Dados
Importação de Bases de Dados SQL Server de Instalações