Recopilación de datos para resolver problemas de scripts de Python y R con Machine Learning Services de SQL Server
Se aplica a: SQL Server 2016 (13.x) y versiones posteriores
Importante
La compatibilidad con Machine Learning Server (anteriormente conocido como R Server) finalizó el 1 de julio de 2022. Para obtener más información, consulte ¿Qué sucederá con Machine Learning Server?
En este artículo se describe cómo recopilar los datos que necesita cuando intenta resolver problemas de Machine Learning Services de SQL Server. Estos datos pueden ser útiles si está resolviendo problemas por su cuenta o con la ayuda del servicio de atención al cliente de Microsoft.
Versión y edición de SQL Server
SQL Server 2016 R Services es la primera versión de SQL Server que incluye compatibilidad integrada con R. SQL Server 2016 Service Pack 1 (SP1) incluye varias mejoras importantes, incluida la capacidad de ejecutar scripts externos. Si usa SQL Server 2016, considere la posibilidad de instalar la versión SP1 o posterior.
SQL Server 2017 y las versiones posteriores tienen integración con el lenguaje Python. La integración de características de Python no es posible en versiones anteriores.
Según cuál sea la edición de SQL Server que use, es posible que algunas funciones de Machine Learning no estén disponibles o estén limitadas.
Versiones de herramientas y lenguaje R
En general, la versión de Microsoft R que se instala al seleccionar la característica R Services o la característica Machine Learning Services viene determinada por el número de compilación de SQL Server. Si aplica una actualización o una revisión en SQL Server, deberá hacer lo propio también con sus componentes de R.
Para obtener una lista de las versiones y vínculos a las descargas de componentes de R, vea Instalación de componentes de Machine Learning en equipos sin acceso a Internet. En los equipos con acceso a Internet, la versión de R que se necesita se identifica e instala automáticamente.
Los componentes de R Server se pueden actualizar de forma independiente del motor de base de datos de SQL Server, en un proceso conocido como enlace. Por lo tanto, la versión de R que use al ejecutar el código de R en SQL Server podría variar en función de la versión instalada de SQL Server y, también, de si migró el servidor a la versión más reciente de R.
Determinar la versión de R
La forma más fácil de determinar la versión de R es obtener las propiedades del runtime ejecutando una instrucción como la siguiente:
EXECUTE sp_execute_external_script
@language = N'R'
, @script = N'
# Transform R version properties to data.frame
OutputDataSet <- data.frame(
property_name = c("R.version", "Revo.version"),
property_value = c(R.Version()$version.string, Revo.version$version.string),
stringsAsFactors = FALSE)
# Retrieve properties like R.home, libPath & default packages
OutputDataSet <- rbind(OutputDataSet, data.frame(
property_name = c("R.home", "libPaths", "defaultPackages"),
property_value = c(R.home(), .libPaths(), paste(getOption("defaultPackages"), collapse=", ")),
stringsAsFactors = FALSE)
)
'
WITH RESULT SETS ((PropertyName nvarchar(100), PropertyValue nvarchar(4000)));
Sugerencia
Si R Services no funciona, pruebe a ejecutar solo la parte del script de R desde RGui.
Como último recurso, puede abrir archivos en el servidor para determinar la versión instalada. Para ello, busque el archivo rlauncher.config para obtener la ubicación del runtime de R y el directorio de trabajo actual. Se recomienda crear y abrir una copia del archivo para no cambiar ninguna de las propiedades por error.
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.<instance_name\MSSQL\Binn\rlauncher.config
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\MSSQL\Binn\rlauncher.config
Para obtener la versión de R y las versiones de RevoScaleR, abra un símbolo del sistema de R o abra la RGui asociada a la instancia.
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.<instancename>\R_SERVICES\bin\x64\RGui.exe
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\R_SERVICES\bin\x64\RGui.exe
La consola de R muestra información de la versión en el inicio. Por ejemplo, la siguiente versión representa la configuración predeterminada de SQL Server 2017:
*Microsoft R Open 3.3.3*
*The enhanced R distribution from Microsoft*
*Microsoft packages Copyright (C) 2017 Microsoft*
*Loading Microsoft R Server packages, version 9.1.0.*
Versiones de Python
Hay varias maneras de obtener la versión de Python. La más sencilla consiste en ejecutar esta instrucción desde Management Studio o cualquier otra herramienta de consulta SQL:
-- Get Python runtime properties:
exec sp_execute_external_script
@language = N'Python'
, @script = N'
import sys
import pkg_resources
OutputDataSet = pandas.DataFrame(
{"property_name": ["Python.home", "Python.version", "Revo.version", "libpaths"],
"property_value": [sys.executable[:-10], sys.version, pkg_resources.get_distribution("revoscalepy").version, str(sys.path)]}
)
'
with WITH RESULT SETS (SQL keywords) ((PropertyName nvarchar(100), PropertyValue nvarchar(4000)));
Si Machine Learning Services no se está ejecutando, puede determinar la versión de Python instalada examinando el archivo pythonlauncher.config. Se recomienda crear y abrir una copia del archivo para no cambiar ninguna de las propiedades por error.
- Solo en SQL Server 2017:
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\MSSQL\Log\ExtensibilityLog\pythonlauncher.config
- Obtenga el valor de PYTHONHOME.
- Obtenga el valor del directorio de trabajo actual.
Nota
Si ha instalado tanto Python como R en SQL Server 2017, el directorio de trabajo y el grupo de cuentas de trabajo serán comunes a ambos lenguajes.
¿Existen varias instancias de R o de Python instaladas?
Compruebe si hay más de una copia de las bibliotecas de R instaladas en el equipo. Esta duplicación puede producirse en los siguientes casos:
- Durante la instalación, seleccionó R Services (en base de datos) y R Server (independiente).
- Tiene instalado Microsoft R Client aparte de SQL Server.
- Se ha instalado un conjunto de bibliotecas de R distinto mediante Herramientas de R para Visual Studio, R Studio, Microsoft R Client u otro IDE de R.
- El equipo hospeda varias instancias de SQL Server, y más de una instancia usa Machine Learning.
Estas condiciones son igualmente válidas para Python.
Si ve que hay varias bibliotecas o runtimes instalados, asegúrese de que obtiene solo los errores relativos a los runtimes de Python o de R que la instancia de SQL Server usa.
Origen de los errores
Los errores que aparecen al intentar ejecutar código de R pueden provenir de cualquiera de los siguientes orígenes:
- Motor de base de datos de SQL Server, incluido el procedimiento almacenado sp_execute_external_script
- SQL Server Trusted Launchpad
- Otros componentes del marco de extensibilidad, incluidos los procesos satélite y los iniciadores de R y Python
- Proveedores como Microsoft Open Database Connectivity (ODBC)
- Lenguaje R
Cuando se trabaja con el servicio por primera vez, puede resultar difícil saber qué mensajes proceden de qué servicios. Se recomienda capturar no solo el texto exacto del mensaje, sino el contexto en el que el mensaje se ha mostrado. Anote el software cliente que esté usando para ejecutar el código de Machine Learning:
- ¿Usa Management Studio? ¿Una aplicación externa?
- ¿Está ejecutando código R en un cliente remoto o directamente en un procedimiento almacenado?
Archivos de registro de SQL Server
Obtenga el registro de errores de SQL Server más reciente. El conjunto completo de registros de errores se compone de los archivos del siguiente directorio de registro predeterminado:
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.SQL2016\MSSQL\Log\ExtensibilityLog
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.SQL2016\MSSQL\Log\ExtensibilityLog
Nota
El nombre exacto de la carpeta varía en función del nombre de la instancia.
Errores devueltos por sp_execute_external_script
Obtenga el texto completo de los errores que se devuelven (si los hay) al ejecutar el comando sp_execute_external_script.
Para no tener en cuenta los problemas de R o Python, puede ejecutar este script, que inicia el runtime de R o Python y pasa los datos, intercambiándolos.
R
exec sp_execute_external_script @language =N'R',
@script=N'OutputDataSet<-InputDataSet',
@input_data_1 =N'select 1 as hello'
with result sets (([hello] int not null));
go
Python
exec sp_execute_external_script @language =N'Python',
@script=N'OutputDataSet= InputDataSet',
@input_data_1 =N'select 1 as hello'
with result sets (([hello] int not null));
go
Errores generados por el marco de extensibilidad
SQL Server genera registros aparte para los runtimes de lenguaje de scripts externos. Estos errores no proceden de los lenguajes Python o R, sino que se generan a partir de los componentes de extensibilidad de SQL Server, incluidos iniciadores específicos de lenguaje y sus procesos satélite.
Estos registros se pueden obtener de las siguientes ubicaciones predeterminadas:
SQL Server 2016
C:\Program Files\Microsoft SQL Server\MSSQL13.<instance_name>\MSSQL\Log\ExtensibilityLog
SQL Server 2017
C:\Program Files\Microsoft SQL Server\MSSQL14.<instance_name>\MSSQL\Log\ExtensibilityLog
Nota
El nombre exacto de la carpeta varía en función del nombre de la instancia. Según la configuración, la carpeta podría estar en otra unidad.
Por ejemplo, los siguientes mensajes de registro tienen que ver con el marco de extensibilidad:
Error de LogonUser para el usuario MSSQLSERVER01
Podría indicar que las cuentas de trabajo que ejecutan scripts externos no pueden acceder a la instancia.
Error de InitializePhysicalUsersPool
Este mensaje podría significar que la configuración de seguridad impide que el programa de instalación cree el grupo de cuentas de trabajo necesarias para ejecutar scripts externos.
Security Context Manager initialization failed (Error de inicialización del administrador de contextos de seguridad)
Satellite Session Manager initialization failed (Error de inicialización del administrador de sesiones satélite)
Eventos del sistema
- Abra el Visor de eventos de Windows y busque en el registro de eventos del sistema mensajes que incluyan la cadena Launchpad.
- Abra el archivo ExtLaunchErrorlog y busque la cadena ErrorCode. Revise el mensaje asociado al código de error.
Por ejemplo, los siguientes mensajes son errores del sistema comunes relacionados con el marco de extensibilidad de SQL Server:
El servicio SQL Server Launchpad (MSSQLSERVER) no ha podido iniciarse debido al siguiente error: <texto>
El servicio no respondió a tiempo a la solicitud de inicio o de control.
Se agotó el tiempo de espera (120000 milisegundos) para la conexión con el servicio SQL Server Launchpad (MSSQLSERVER).
Archivos de volcado de memoria
Si posee conocimientos de depuración, puede usar los archivos de volcado de memoria para analizar un error en Launchpad.
- Busque la carpeta que contenga los registros de arranque del programa de instalación de SQL Server. Por ejemplo, en SQL Server 2016, la ruta de acceso predeterminada es C:\Archivos de programa\Microsoft SQL Server\130\Setup Bootstrap\Log.
- Abra la subcarpeta de registros de arranque específica de la extensibilidad.
- Si necesita enviar una solicitud de soporte técnico, agregue todo el contenido de esta carpeta a un archivo comprimido. Por ejemplo, C:\Archivos de programa\Microsoft SQL Server\130\Setup Bootstrap\Log\LOG\ExtensibilityLog.
La ubicación exacta podría diferir en el sistema y podría estar en una unidad distinta de la unidad C. Asegúrese de obtener los registros de la instancia en la que Machine Learning está instalado.
Parámetros de configuración
En esta sección se enumeran otros componentes o proveedores que pueden ser origen de errores al ejecutar scripts de R o Python.
¿Qué protocolos de red hay disponibles?
Machine Learning Services requiere los siguientes protocolos de red para la comunicación interna entre los componentes de extensibilidad y para la comunicación con clientes de R o de Python externos.
- Canalizaciones con nombre
- TCP/IP
Abra el Administrador de configuración de SQL Server para saber si un protocolo está instalado y, si lo está, para saber si está habilitado.
Permisos y configuración de seguridad
En cuentas de trabajo:
- En el Panel de control, abra Usuarios y grupos y busque el grupo usado para ejecutar trabajos de script externos. Ese grupo es SQLRUserGroup de forma predeterminada.
- Compruebe que el grupo existe y que contiene al menos una cuenta de trabajo.
- En SQL Server Management Studio, seleccione la instancia en la que se van a ejecutar trabajos de R o Python, seleccione Seguridad y, después, determine si hay un inicio de sesión para SQLRUserGroup.
- Revise los permisos del grupo de usuarios.
En cuentas de usuario individuales:
Determine si la instancia admite solo la autenticación de modo mixto, solo inicios de sesión de SQL o solo la autenticación de Windows. Esta configuración afecta a los requisitos de código de R o de Python.
Por cada usuario que necesite ejecutar código de R, determine el nivel de permisos necesario en cada base de datos donde se van a escribir objetos desde R, donde se va a acceder a los datos o donde se van a crear objetos.
Para habilitar la ejecución de scripts, cree roles o agregue usuarios a los siguientes roles, según sea necesario:
- Todos excepto db_owner: se requiere EXECUTE ANY EXTERNAL SCRIPT.
- db_datawriter: para escribir resultados de R o de Python.
- db_ddladmin: para crear objetos.
- db_datareader: para leer los datos que el código de R o de Python usa.
Tenga en cuenta si cambió alguna cuenta de inicio predeterminada al instalar SQL Server 2016.
Si un usuario necesita instalar nuevos paquetes de R o usar paquetes de R instalados por otros usuarios, puede que tenga que habilitar la administración de paquetes en la instancia y, luego, asignar más permisos.
¿Qué carpetas están sujetas a bloqueos del software antivirus?
El software antivirus puede bloquear carpetas, lo que impide que se instalen las características de Machine Learning y los scripts se ejecuten correctamente. Determine si alguna carpeta del árbol de SQL Server está sujeta a la detección de virus.
Cuando se instalan varios servicios o características en una instancia, puede resultar complicado enumerar todas las carpetas posibles que esa instancia usa. Por ejemplo, cuando se agregan nuevas características, se deben identificar y excluir las nuevas carpetas.
Además, algunas características crean carpetas dinámicamente en tiempo de ejecución. Es el caso de las tablas OLTP en memoria, los procedimientos almacenados y las funciones: todos ellos crean directorios en tiempo de ejecución. Estos nombres de carpeta suelen contener GUID y no se pueden predecir. SQL Server Trusted Launchpad crea directorios de trabajo para los trabajos de script de R y de Python.
Dado que existe la posibilidad de que no se puedan excluir todas las carpetas que el proceso de SQL Server y sus características necesitan, se recomienda excluir todo el árbol de directorio de instancias de SQL Server.
¿Está abierto el firewall para SQL Server? ¿Admite la instancia conexiones remotas?
Para saber si SQL Server admite conexiones remotas, vea Configurar conexiones de servidor remoto.
Averigüe si se ha creado una regla de firewall para SQL Server. Por motivos de seguridad, en una instalación predeterminada es posible que el cliente de R o de Python remoto no pueda conectarse a la instancia. Para más información, vea Solucionar problemas de conexión a SQL Server.