Partilhar via


microsoftml (pacote Python em SQL Server Machine Learning Services)

Aplica-se a: SQL Server 2017 (14.x) e versões posteriores

o microsoftml é um pacote Python da Microsoft que fornece algoritmos de aprendizagem automática de alto desempenho. Inclui funções para treino e transformações, pontuação, análise de texto e imagem, e extração de características para derivar valores a partir de dados existentes. O pacote está incluído nos Serviços de Aprendizagem Automática do SQL Server e suporta alto desempenho em big data, utilizando processamento multicore e fluxo rápido de dados.

Detalhes do pacote Informação
Versão atual: 9.4
Desenvolvido sobre: Distribuição Anaconda 4.2 de Python 3.7.1
Distribuição de pacotes: SQL Server Machine Learning Services versão 2017 ou 2019.

Como usar o microsoftml

O módulo microsoftml é instalado como parte dos Serviços de Aprendizagem Automática do SQL Server quando adiciona Python à sua instalação. Obtém-se a coleção completa de pacotes proprietários mais uma distribuição Python com os seus módulos e interpretadores. Podes usar qualquer IDE Python para escrever funções de chamada de scripts em Python na MicrosoftML, mas o script tem de correr num computador com SQL Server Machine Learning Services em Python.

Microsoftml e revoscalepy estão fortemente acoplados; As fontes de dados usadas no Microsoft Scale são definidas como objetos RevoScalepy . Limitações de contexto de cálculo na transferência de revoscalepy para microsoftml. Nomeadamente, toda a funcionalidade está disponível para operações locais, mas a mudança para um contexto de computação remota requer RxSpark ou RxInSQLServer.

Versões e plataformas

O módulo microsoftml está disponível apenas quando instala um dos seguintes produtos Microsoft ou faz downloads:

Observação

As versões completas do produto são apenas para Windows no SQL Server 2017. Tanto o Windows como o Linux são suportados para microsoftml no SQL Server 2019.

Dependências do pacote

Os algoritmos no microsoftml dependem da revoscalepy para:

  • Objetos fonte de dados - Os dados consumidos pelas funções microsoftml são criados usando funções revoscalepy .
  • Computação remota (transferir a execução de funções para uma instância remota do SQL Server) - O pacote revoscalepy fornece funções para criar e ativar um contexto de computação remota para o SQL Server.

Na maioria dos casos, vais carregar os pacotes juntos sempre que estiveres a usar o microsoftml.

Funções por categoria

Esta secção lista as funções por categoria para lhe dar uma ideia de como cada uma é utilizada. Também pode usar o índice para encontrar funções por ordem alfabética.

1-Funções de formação

Função Description
microsoftml.rx_ensemble Treina um conjunto de modelos.
microsoftml.rx_fast_forest Floresta aleatória.
microsoftml.rx_fast_linear Modelo Linear. com Subida Estocástica de Coordenadas Duplas.
microsoftml.rx_fast_trees Árvores Impulsionadas.
microsoftml.rx_logistic_regression Regressão Logística.
microsoftml.rx_neural_network Rede Neural.
microsoftml.rx_oneclass_svm Deteção de Anomalias.

2-Funções de transformação

Tratamento de variáveis categóricas

Função Description
microsoftml.categorical Converte uma coluna de texto em categorias.
microsoftml.categorical_hash Faz hashes e converte uma coluna de texto em categorias.

Manipulação de esquema

Função Description
microsoftml.concat Concatena múltiplas colunas num único vetor.
microsoftml.drop_columns Elimina colunas de um conjunto de dados.
microsoftml.select_columns Mantém colunas de um conjunto de dados.

Seleção de variáveis

Função Description
microsoftml.count_select Seleção de funcionalidades com base nas contagens.
microsoftml.mutualinformation_select Seleção de funcionalidades com base em informação mútua.

Análise de texto

Função Description
microsoftml.featurize_text Converte colunas de texto em funcionalidades numéricas.
microsoftml.get_sentiment Análise de sentimento.

Análise de imagens

Função Description
microsoftml.load_image Carrega uma imagem.
microsoftml.resize_image Redimensiona uma imagem.
microsoftml.extract_pixels Extrai píxeis de uma imagem.
microsoftml.featurize_image Converte uma imagem em funcionalidades.

Funções de caracterização

Função Description
microsoftml.rx_featurize Transformação de dados para fontes de dados

Funções de pontuação

Função Description
microsoftml.rx_predict Pontuações usando um modelo de aprendizagem automática Microsoft

Como chamar a microsoftml

As funções no microsoftml são chamáveis em código Python encapsulado em procedimentos armazenados. A maioria dos programadores constrói soluções microsoftml localmente e depois migra código Python acabado para procedimentos armazenados como exercício de deployment.

O pacote microsoftml para Python é instalado por defeito, mas ao contrário do revoscalepy, não é carregado por defeito quando inicias uma sessão Python usando os executáveis Python instalados com o SQL Server.

Como primeiro passo, importa o pacote microsoftml e importa o revoscalepy se precisares de usar contextos de computação remota ou conectividade relacionada ou objetos de fonte de dados. Depois, faz referência às funções individuais de que precisas.

from microsoftml.modules.logistic_regression.rx_logistic_regression import rx_logistic_regression
from revoscalepy.functions.RxSummary import rx_summary
from revoscalepy.etl.RxImport import rx_import_datasource

Consulte também