Exportar Dados

Importante

O suporte para o Estúdio de ML (clássico) terminará a 31 de agosto de 2024. Recomendamos a transição para o Azure Machine Learning até essa data.

A partir de 1 de dezembro de 2021, não poderá criar novos recursos do Estúdio de ML (clássico). Até 31 de agosto de 2024, pode continuar a utilizar os recursos existentes do Estúdio de ML (clássico).

A documentação do Estúdio de ML (clássico) está a ser descontinuada e poderá não ser atualizada no futuro.

Escreve um conjunto de dados para várias formas de armazenamento em nuvem em Azure, tais como tabelas, bolhas e bases de dados Azure SQL

Categoria: Entrada e Saída de Dados

Nota

Aplica-se a: Machine Learning Studio (clássico) apenas

Módulos semelhantes de arrasto e queda estão disponíveis em Azure Machine Learning designer.

Visão geral do módulo

Este artigo descreve como usar o módulo de Dados de Exportação em Machine Learning Studio (clássico), para guardar resultados, dados intermédios e dados de trabalho das suas experiências em destinos de armazenamento em nuvem fora Machine Learning Studio (clássico).

Este módulo suporta a exportação ou a poupança dos seus dados para os seguintes serviços de dados em nuvem:

  • Exportação para Consulta de Colmeia: Escreva dados para uma tabela de Colmeia num cluster hdInsight Hadoop.

  • Exportação para Base de Dados SQL do Azure: Guardar dados para Base de Dados SQL do Azure ou para Azure SQL Data Warehouse.

  • Exportação para quadro Azure: Guarde os dados para o serviço de armazenamento de mesa em Azure. O armazenamento de mesa é bom para armazenar grandes quantidades de dados. Fornece um formato tabular que é escalável, barato e altamente disponível.

  • Exportação para Azure Blob Armazenamento: Guarda dados para o serviço Blob em Azure. Esta opção é útil para imagens, textos não estruturados ou dados binários. Os dados no serviço Blob podem ser partilhados publicamente ou guardados em lojas de dados de aplicações seguras.

Nota

O módulo de dados de exportação não suporta a ligação à conta de armazenamento Azure Blob se a opção "Secure Transfer Required" estiver ativada.

  • Baixar dados: Para descarregar os seus dados para que possa abri-lo em Excel ou outra aplicação, utilize um módulo como Converter para CSV ou Converter para TSV para preparar os dados num determinado formato e, em seguida, descarregar os dados.

  • Pode descarregar os resultados de qualquer módulo que produza um conjunto de dados clicando corretamente na saída e selecionando o conjunto de dados de descarregamento. Por padrão, os dados são exportados em formato CSV.

  • Faça o download de uma definição de módulo ou gráfico de experiência: Uma nova biblioteca PowerShell permite-lhe descarregar os metadados completos para a sua experiência, ou os detalhes de um módulo específico. A PowerShell para Machine Learning biblioteca é um lançamento experimental, mas tem muitos cmdlets úteis:

    • Get-AmlExperiment lista todas as experiências num espaço de trabalho.
    • Export-AmlExperimentGraph exporta uma definição da experiência completa para um ficheiro JSON.
    • Download-AmlExperimentNodeOutput permite extrair as informações fornecidas nas portas de saída de qualquer módulo.

Como configurar dados de exportação

  1. Adicione o módulo de Dados de Exportação à sua experiência no Studio (clássico). Pode encontrar este módulo na categoria Entrada e Saída .

  2. Ligação Dados de Exportação para o módulo que contenha os dados que pretende exportar.

  3. Clique em dados de exportação duplos para abrir o painel propriedades .

  4. Para o destino Data, selecione o tipo de armazenamento em nuvem onde irá guardar os seus dados. Se esporá-lo, todas as outras propriedades serão reiniciadas. Então não se esqueça de escolher esta opção primeiro!

  5. Forneça um nome de conta e um método de autenticação necessário para aceder à conta de armazenamento especificada.

    Dependendo do tipo de armazenamento e se a conta está segura, poderá ser necessário fornecer o nome da conta, o tipo de ficheiro, a chave de acesso ou o nome do contentor. Para fontes que não necessitam de autenticação, geralmente é suficiente conhecer o URL.

    Por exemplo, de cada tipo, consulte os seguintes tópicos:

  6. A opção, Use resultados em cache, permite-lhe repetir a experiência sem reescrever os mesmos resultados de cada vez.

    Se desmarcar esta opção, os resultados são escritos para armazenamento sempre que a experiência é executada, independentemente de os dados de saída mudarem.

    Se selecionar esta opção, os Dados de Exportação utilizam dados em cache, se disponíveis. Os novos resultados só são gerados quando há uma alteração a montante que afetaria os resultados.

  7. Execute a experimentação.

Exemplos

Por exemplo, como utilizar o módulo de Dados de Exportação , consulte a Galeria Azure AI:

Notas técnicas

Esta secção contém detalhes de implementação, dicas e respostas a perguntas frequentes.

Detalhes de implementação

  • Este módulo foi anteriormente nomeado Escritor. Se tiver uma experiência existente que utilize o módulo Writer , o módulo é renomeado para Dados de Exportação quando refrescar a experiência.

  • Nem todos os módulos produzem saídas compatíveis com destinos de Dados de Exportação . Por exemplo, os Dados de Exportação não podem salvar um conjunto de dados que tenha sido convertido para o formato SVMLight. Os Dados de Exportação suportam estes formatos:

    • Conjunto de dados (Azure ML formato interno)
    • .NET DataTable
    • CSV com ou sem cabeçalhos
    • TSV com ou sem cabeçalhos

Problemas conhecidos

  • Quando seleciona a Tabela Azure como a localização para a produção dos seus dados, ocasionalmente pode haver um erro ao escrever para a tabela especificada. Quando isto acontece, os dados podem ser escritos para uma bolha.

    Se este erro acontecer e mais tarde não conseguir ler a partir da tabela esperada, tente utilizar um utilitário de armazenamento Azure para verificar as bolhas no recipiente especificado na sua conta de armazenamento.

  • Atualmente, não é possível guardar uma bolha numa tabela de Colmeia especificada. Se precisar de escrever resultados intermédios, evite utilizar uma tabela De Colmeia em HDInsight e utilize o armazenamento de bolhas ou armazenamento de mesa.

  • Atualmente, se selecionar o HDFS como a localização para guardar dados de saída, esta mensagem de erro é devolvida: "Microsoft.Analytics.Exceptions.ErrorMapping+ModuleException".

Entradas esperadas

Nome Tipo Description
Conjunto de dados Tabela de Dados O conjunto de dados a ser escrito.

Parâmetros do módulo

Esta tabela lista os parâmetros que se aplicam a todas as opções de Dados de Exportação . Outros parâmetros são dinâmicos e alterados dependendo do destino de dados que seleciona.

Name Intervalo Tipo Predefinição Description
Por favor, especifique o destino dos dados Lista DataSourceOrSink Serviço blob em Azure Armazenamento Indique se o destino dos dados é um ficheiro no serviço Blob, um ficheiro no serviço Table, uma base de dados SQL em Azure ou uma tabela Hive.
Use resultados em cache VERDADEIRO/FALSO Booleano FALSE Selecione esta opção para evitar reescrever resultados desnecessariamente. Se algo mudar a montante na experiência, os Dados de Exportação executarão e escreverão sempre novos resultados. No entanto, se nada tiver mudado, e tiver selecionado esta opção, os Dados de Exportação não serão executados para evitar reescrever os mesmos resultados.

Exceções

Exceção Description
Erro 0057 Uma exceção ocorre ao tentar criar um ficheiro ou bolha que já existe.
Erro 0001 Uma exceção ocorre se uma ou mais colunas especificadas do conjunto de dados não puderem ser encontradas.
Erro 0027 Uma exceção ocorre quando dois objetos têm que ter o mesmo tamanho, mas não são.
Erro 0079 Ocorre uma exceção se o nome do recipiente em Azure Armazenamento for especificado incorretamente.
Erro 0052 Ocorre uma exceção se a chave de acesso à conta Azure for especificada incorretamente.
Erro 0064 Uma exceção ocorre se o nome da conta ou a chave de acesso ao armazenamento da conta Azure forem especificados incorretamente.
Erro 0071 Ocorre uma exceção se as credenciais fornecidas estiverem incorretas.
Erro 0018 Uma exceção ocorre se o conjunto de dados de entrada não for válido.
Erro 0029 Uma exceção ocorre quando um URI inválido é passado.
Erro 0003 Uma exceção ocorre se uma ou mais entradas forem nulas ou vazias.

Para obter uma lista de erros específicos dos módulos Studio (clássicos), consulte Machine Learning Códigos de Erro.

Para obter uma lista de exceções da API, consulte Machine Learning CÓDIGOs de Erro da API REST.

Ver também

Importar Dados
Entrada e saída de dados
Transformação de Dados
Comparando a tabela Azure Armazenamento e Base de Dados SQL do Azure
Lista de Módulos A-Z