Partilhar via


Instale os Serviços de Aprendizagem Automática do SQL Server 2022 (Python e R) no Linux

Aplica-se a: SQL Server 2022 (16.x) no Linux

Este artigo orienta-o na instalação dos Serviços de Aprendizagem Automática SQL Server no Linux. Scripts Python e R podem ser executados na base de dados usando Serviços de Aprendizagem Automática.

Pode instalar Serviços de Aprendizagem Automática no Ubuntu e Red Hat Enterprise Linux (RHEL). Atualmente, o SUSE Linux Enterprise Server (SLES) não é suportado.

Podes instalar ML Services num contentor Docker a correr uma distribuição Linux. Dentro do contentor Docker, os passos seriam os mesmos que abaixo.

Para mais informações, consulte a secção Plataformas Suportadas na orientação de instalação do SQL Server no Linux.

Importante

Este artigo refere-se ao SQL Server 2022 (16.x). Para SQL Server 2019 em Linux, consulte Instalar SQL Server 2019 Machine Learning Services (Python e R) no Linux. Para SQL Server no Windows, veja Instalar SQL Server 2022 Machine Learning Services (Python e R) no Windows.

Lista de verificação pré-instalação

  • Instala o SQL Server no Linux e verifica a instalação.

  • Verifique os repositórios SQL Server Linux para as extensões Python e R. Se já configurou repositórios de origem para a instalação do motor de base de dados, pode executar os comandos de instalação do pacote mssql-server-extensibility usando o mesmo registo de repositório.

  • Deverias ter uma ferramenta para executar comandos T-SQL.

  • Será necessário reiniciar a instância do SQL Server durante este processo de instalação.

Lista de pacotes

Num dispositivo ligado à internet, os pacotes são descarregados e instalados independentemente do motor de base de dados usando o instalador de pacotes para cada sistema operativo.

Pacotes de instalação disponíveis para SQL Server 2022 (16.x) no Linux:

Nome do pacote Aplicável a Description
mssql-server-extensibility Todos Framework de extensibilidade usado para executar Python e R.

Instalar o pacote mssql-server-extensibility

  1. Configurar repositórios para instalar e atualizar o SQL Server no Linux correspondente à distribuição Linux. Instale a funcionalidade de extensibilidade do SQL Server com o pacote mssql-server-extensibility e a dependência libssl-devassociada .

    Ubuntu

    sudo apt-get install mssql-server-extensibility libssl-dev
    

    RHEL

    yum install mssql-server-extensibility
    
  2. Revise e aceite o Acordo de Licença de Utilizador Final (EULA) para os Serviços de ML do SQL Server.

    sudo /opt/mssql/bin/mssql-conf set EULA accepteulaml Y
    

    Para completar a aceitação do EULA, a instância do SQL Server deve ser reiniciada.

    sudo systemctl restart mssql-server
    

Instalar tempos de execução e pacotes

Configuração do suporte R

Instalar o ambiente de execução do R

  1. Descarregue e instale a versão do R que desejarem. Escolha uma versão do R 4.2 ou superior, disponível para download direto da cran.r-project.org. Siga as instruções para o tempo de execução desejado.

  2. Abrir um terminal R de administrador:

    sudo R
    
  3. Instale dependências para CompatibilityAPI e RevoScaleR executando o seguinte:

    # R Terminal
    install.packages("iterators", lib="/usr/lib/R/library")
    install.packages("foreach", lib="/usr/lib/R/library")
    install.packages("R6", lib="/usr/lib/R/library")
    install.packages("jsonlite", lib="/usr/lib/R/library")
    
  4. Descarregar e instalar CompatibilityAPI e RevoScaleR para Linux.

    install.packages("https://aka.ms/sqlml/r4.2/linux/CompatibilityAPI_1.1.0_R_x86_64-pc-linux-gnu.tar.gz", repos=NULL, lib="/usr/lib/R/library")
    install.packages("https://aka.ms/sqlml/r4.2/linux/RevoScaleR_10.0.1_R_x86_64-pc-linux-gnu.tar.gz", repos=NULL, lib="/usr/lib/R/library")
    
  5. Verifique a instalação RevoScaleR a partir do terminal R.

    library("RevoScaleR")
    

Configurar o tempo de execução do R com o SQL Server

  1. Configure o R runtime instalado com SQL Server para Linux, onde path/to/ é o caminho do arquivo para o binário R, e RFolderVersion é o nome da pasta da versão específica para a sua instalação do R runtime, por exemplo, R4.2.

    sudo /opt/mssql/bin/mssql-conf set extensibility rbinpath /usr/lib/R/bin/R
    sudo /opt/mssql/bin/mssql-conf set extensibility datadirectories /usr/lib/R
    
  2. Reinicia o Launchpadd serviço.

    systemctl restart mssql-launchpadd.service
    
  3. Configure o SQL Server para Linux para permitir scripts externos usando o sp_configure procedimento armazenado do sistema.

    EXECUTE sp_configure 'external scripts enabled', 1;
    GO
    
    RECONFIGURE;
    GO
    
  4. Verifique a instalação executando um simples comando T-SQL para devolver a versão do R:

    EXECUTE sp_execute_external_script
        @script = N'print(R.version)',
        @language = N'R';
    GO
    

Configuração de suporte para Python

Instalar o ambiente de execução Python

  1. Descarregue e instale Python. Escolha especificamente a versão Python 3.10, disponível para download direto da python.org. Siga as instruções fornecidas. Além disso, instala a biblioteca de execução partilhada do Python para a versão de tempo de execução. Por exemplo, para instalar libpython3.10 no Ubuntu: sudo apt-get install libpython3.10.

  2. Descarregue e instale revoscalepy para o utilizador root.

    sudo pip install dill numpy==1.22.0 pandas patsy python-dateutil
    sudo pip install https://aka.ms/sqlml/python3.10/linux/revoscalepy-10.0.1-py3-none-any.whl --target=/usr/lib/python3.10/dist-packages
    
  3. Verifica a revoscalepy instalação a partir do terminal Python. Verifica se a biblioteca pode ser importada.

    import revoscalepy
    

Configurar o tempo de execução do Python com o SQL Server

  1. Configure o runtime Python instalado com o SQL Server, onde pythonbinpath está definido no caminho do binário Python instalado, e datadirectories inclui o caminho onde os pacotes são instalados para a versão desejada do Python, por exemplo, /usr/lib/python3.10/dist-packages. Use o seguinte script com o seu caminho real de instalação:

    sudo /opt/mssql/bin/mssql-conf set extensibility pythonbinpath /usr/bin/python3.10
    sudo /opt/mssql/bin/mssql-conf set extensibility datadirectories /usr/lib:/usr/lib/python3.10/dist-packages
    
  2. Reinicia o Launchpadd serviço.

    systemctl restart mssql-launchpadd.service
    
  3. Configure o SQL Server para Linux para permitir scripts externos usando o sp_configure procedimento armazenado do sistema.

    EXECUTE sp_configure 'external scripts enabled', 1;
    GO
    
    RECONFIGURE;
    GO
    
  4. Verifique a instalação executando um simples comando T-SQL para devolver a versão do python:

    EXECUTE sp_execute_external_script
        @script = N'import sys;print(sys.version)',
        @language = N'Python';
    GO
    

Instalar o Java

Para instalar a extensão da linguagem Java, consulte Instalar a Extensão da Linguagem Java do SQL Server no Linux.

Verificar instalação

Para validar a instalação, utilize qualquer um dos seguintes métodos:

  • Execute um script T-SQL que execute um procedimento armazenado do sistema invocando Python ou R usando uma ferramenta de consulta.

  • Execute o seguinte comando SQL para testar a execução de R no SQL Server. Erros? Tente reiniciar o serviço, sudo systemctl restart mssql-server.service.

    EXECUTE sp_execute_external_script
        @language = N'R',
        @script = N'
          OutputDataSet <- InputDataSet', @input_data_1 = N'SELECT 1 AS hello'
        WITH RESULT SETS
    (
            ([hello] INT NOT NULL)
    );
    GO
    
  • Execute o seguinte comando SQL para testar a execução em Python no SQL Server.

    EXECUTE sp_execute_external_script
        @language = N'Python',
        @script = N'
          OutputDataSet = InputDataSet;
          ', @input_data_1 = N'SELECT 1 AS hello'
        WITH RESULT SETS
    (
            ([hello] INT NOT NULL)
    );
    GO
    

Instalação offline

Siga as instruções de instalação offline para os passos de instalação dos pacotes. Encontre o seu site de downloads e depois descarregue pacotes específicos usando a lista de pacotes abaixo.

Sugestão

Várias das ferramentas de gestão de pacotes fornecem comandos que podem ajudar a determinar dependências de pacotes. Para yum, use sudo yum deplist [package]. Para o Ubuntu, use sudo apt-get install --reinstall --download-only [package name] seguido de dpkg -I [package name].deb.

Pacotes RevoScale autônomos para Python e R runtime

Os pacotes RevoScale também são suportados em forma de pacote autónomo com ambientes de execução Python e R. Para configurar o tempo de execução Python ou R para o cenário autônomo, siga as instruções nas seções Install Python runtime e Install R runtime , respectivamente.