Saiba como carregar seus conjuntos de dados de treinamento de um arquivo ou banco de dados SQL Server para uso em um dos cenários do Model Builder para ML.NET. Os cenários do Model Builder podem usar bancos de dados SQL Server, arquivos de imagem e formatos de arquivo CSV ou TSV como dados de treinamento.
O Model Builder só aceita arquivos TSV, CSV e TXT com delimitadores de vírgula, tabulação e ponto e vírgula e imagens PNG e JPG.
Cenários do Model Builder
O Model Builder ajuda você a criar modelos para os seguintes cenários de machine learning:
Classificação de dados (classificação multiclasse e binária): Classifique dados de texto em duas ou mais categorias.
Previsão de valor (regressão): prever um valor numérico.
Classificação de imagens (aprendizado profundo): Classifique as imagens em duas ou mais categorias.
Recomendação (recomendação): Produza uma lista de itens sugeridos para um determinado usuário.
Detecção de objetos (aprendizado profundo): Detecte e identifique objetos em imagens. Isso pode localizar um ou mais objetos e rotulá-los de acordo.
Este artigo aborda a classificação e regressão com dados textuais ou numéricos, classificação de imagens e cenários de detecção de objetos.
Carregar texto ou dados numéricos de um arquivo
Você pode carregar texto ou dados numéricos de um arquivo no Model Builder. Ele aceita formatos de arquivo delimitados por vírgulas (CSV) ou delimitados por tabulações (TSV).
Na etapa de dados do Model Builder, selecione Arquivo como o tipo de fonte de dados.
Selecione o botão Procurar ao lado da caixa de texto e use o Explorador de Arquivos para navegar e selecionar o arquivo de dados.
Escolha uma categoria na lista suspensa Coluna para prever (rótulo).
Observação
Cenários de classificação de dados (opcionais): se o tipo de dados de sua coluna de rótulo (o valor na lista suspensa "Coluna para prever (Rótulo)") estiver definido como Booleano (Verdadeiro/Falso), um algoritmo de classificação binária é usado em seu pipeline de treinamento de modelo. Caso contrário, um treinador de classificação multiclasse é usado. Use as Opções de dados avançadas para modificar o tipo de dados para sua coluna de rótulo e informar ao Model Builder qual tipo de treinador ele deve usar para seus dados.
Atualize os dados no link Opções de dados avançadas para definir as configurações da coluna ou para atualizar a formatação dos dados.
Você terminou de configurar seu arquivo de fonte de dados para o Model Builder. Clique no botão Próxima etapa para passar para a próxima etapa no Model Builder.
Carregar dados de um banco de dados SQL Server
O Model Builder oferece suporte ao carregamento de dados de bancos de dados SQL Server locais e remotos.
Arquivo de banco de dados local
Para carregar dados de um arquivo de banco de dados SQL Server no Model Builder:
Na etapa de dados do Model Builder, selecione SQL Server como o tipo de fonte de dados.
Selecione o botão Escolher fonte de dados.
Na caixa de diálogo Escolher a Fonte de Dados , selecione Arquivo de Banco de Dados do Microsoft SQL Server.
Desmarque a caixa de seleção Sempre usar esta seleção e selecione Continuar
Na caixa de diálogo Propriedades da conexão, selecione Procurar e selecione o arquivo .MDF baixado.
Selecione OK
Escolha o nome do conjunto de dados na lista suspensa Nome da tabela.
Na lista suspensa Coluna a ser prevista (Rótulo), escolha a categoria de dados na qual você deseja fazer uma previsão.
Observação
Cenários de classificação de dados (opcionais): se o tipo de dados de sua coluna de rótulo (o valor na lista suspensa "Coluna para prever (Rótulo)") estiver definido como Booleano (Verdadeiro/Falso), um algoritmo de classificação binária é usado em seu pipeline de treinamento de modelo. Caso contrário, um treinador de classificação multiclasse é usado. Use as Opções de dados avançadas para modificar o tipo de dados para sua coluna de rótulo e informar ao Model Builder qual tipo de treinador ele deve usar para seus dados.
Atualize os dados no link Opções de dados avançadas para definir as configurações da coluna ou para atualizar a formatação dos dados.
Banco de dados remoto
Para carregar dados de uma conexão de banco de dados SQL Server no Model Builder:
Na etapa de dados do Model Builder, selecione SQL Server como o tipo de fonte de dados.
Selecione o botão Escolher fonte de dados.
Na caixa de diálogo Escolher fonte de dados, selecione Microsoft SQL Server.
Na caixa de diálogo Propriedades da conexão, insira as propriedades de seu banco de dados Microsoft SQL.
Forneça o nome do servidor que contém a tabela à qual você deseja se conectar.
Configure a autenticação para o servidor. Se Autenticação do SQL Server estiver selecionado, insira o nome de usuário e a senha do servidor.
Selecione a qual banco de dados se conectar na lista suspensa Selecionar ou inserir um nome de banco de dados. Isso deve ser preenchido automaticamente se o nome do servidor e as informações de login estiverem corretas.
Selecione OK
Escolha o nome do conjunto de dados na lista suspensa Nome da tabela.
Na lista suspensa Coluna a ser prevista (Rótulo), escolha a categoria de dados na qual você deseja fazer uma previsão.
Observação
Cenários de classificação de dados (opcionais): se o tipo de dados de sua coluna de rótulo (o valor na lista suspensa "Coluna para prever (Rótulo)") estiver definido como Booleano (Verdadeiro/Falso), um algoritmo de classificação binária é usado em seu pipeline de treinamento de modelo. Caso contrário, um treinador de classificação multiclasse é usado. Use as Opções de dados avançadas para modificar o tipo de dados para sua coluna de rótulo e informar ao Model Builder qual tipo de treinador ele deve usar para seus dados.
Atualize os dados no link Opções de dados avançadas para definir as configurações da coluna ou para atualizar a formatação dos dados.
Você terminou de configurar seu arquivo de fonte de dados para o Model Builder. Clique no link do botão Próxima etapa para ir para a próxima etapa no Model Builder.
Configurar arquivos de dados de classificação de imagem
O Model Builder espera que os dados de classificação de imagem sejam arquivos JPG ou PNG organizados em pastas que correspondem às categorias da classificação.
Para carregar imagens no Model Builder, forneça o caminho para um único diretório de nível superior:
Esse diretório de nível superior contém uma subpasta para cada uma das categorias a serem previstas.
Cada subpasta contém os arquivos de imagem pertencentes à sua categoria.
Na estrutura de pastas ilustrada abaixo, o diretório de nível superior é flower_photos. Há cinco subdiretórios correspondentes às categorias que você deseja prever: margarida, dente-de-leão, rosas, girassóis e tulipas. Cada um desses subdiretórios contém imagens pertencentes à sua respectiva categoria.
Configurar arquivos de dados de imagem de detecção de objetos
O Model Builder espera que os dados da imagem de detecção de objetos estejam no formato JSON gerados a partir de VoTT. O arquivo JSON está localizado na pasta vott-json-export no Local de destino especificado nas configurações do projeto.
O arquivo JSON consiste nas seguintes informações geradas a partir do VoTT:
A fonte deste conteúdo pode ser encontrada no GitHub, onde você também pode criar e revisar problemas e solicitações de pull. Para obter mais informações, confira o nosso guia para colaboradores.
Comentários do .NET
O .NET é um projeto código aberto. Selecione um link para fornecer comentários:
Gerenciar a ingestão e a preparação de dados, o treinamento e a implantação de modelos e o monitoramento da solução de machine learning com Python, Azure Machine Learning e MLflow.