Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
SE APLICA A: Azure Data Factory
Azure Synapse Analytics
Sugerencia
Pruebe Data Factory en Microsoft Fabric, una solución de análisis integral para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita
En este artículo se describe el uso de la actividad de copia en una canalización de Azure Data Factory o Synapse Analytics para copiar datos de Pesto. El documento se basa en el artículo de introducción a la actividad de copia que describe información general de la actividad de copia.
Importante
La versión 2.0 del conector de Presto proporciona compatibilidad nativa mejorada con Presto. Si usa la versión 1.0 del conector de Presto en la solución, actualice el conector de Presto antes del 31 de agosto de 2025. Consulte esta sección para obtener más información sobre la diferencia entre la versión 2.0 y la versión 1.0.
Funcionalidades admitidas
El conector Presto es compatible con las siguientes funcionalidades:
Funcionalidades admitidas | IR |
---|---|
Actividad de copia (origen/-) | 1 2 |
Actividad de búsqueda | 1 2 |
① Azure Integration Runtime ② Entorno de ejecución de integración autohospedado
Consulte la tabla de almacenes de datos compatibles para ver una lista de almacenes de datos que la actividad de copia admite como orígenes o receptores.
El servicio proporciona un controlador integrado para habilitar la conectividad. Por lo tanto, no es necesario instalar manualmente ningún controlador mediante este conector.
Introducción
Para realizar la actividad de copia con una canalización, puede usar una de los siguientes herramientas o SDK:
- La herramienta Copiar datos
- Azure Portal
- El SDK de .NET
- El SDK de Python
- Azure PowerShell
- API REST
- La plantilla de Azure Resource Manager
Creación de un servicio vinculado a Presto mediante la interfaz de usuario
Siga estos pasos para crear un servicio vinculado a Presto en la interfaz de usuario de Azure Portal.
Vaya a la pestaña Administrar del área de trabajo de Azure Data Factory o Synapse y seleccione Servicios vinculados; luego haga clic en Nuevo:
Busque Presto y seleccione el conector de Presto.
Configure los detalles del servicio, pruebe la conexión y cree el servicio vinculado.
Detalles de configuración del conector
En las secciones siguientes se proporcionan detalles sobre las propiedades que se usan para definir entidades de Data Factory específicas del conector de Presto.
Propiedades del servicio vinculado
El conector de Presto ahora admite la versión 2.0. Consulte esta sección para actualizar la versión del conector de Spark desde la versión 1.0. Para obtener los detalles de la propiedad, consulte las secciones correspondientes.
Versión 2.0
El servicio vinculado de Presto admite las siguientes propiedades cuando se aplica la versión 2.0:
Propiedad | Descripción | Obligatorio |
---|---|---|
tipo | La propiedad type debe establecerse en: Presto | Sí |
Versión | Versión que especifique. El valor es 2.0 . |
Sí |
anfitrión | Dirección IP o nombre de host del servidor de Presto. (por ejemplo, 192.168.222.160) | Sí |
catálogo | Contexto de catálogo para todas las solicitudes en el servidor. | Sí |
puerto | Puerto TCP que el servidor de Presto utiliza para escuchar las conexiones del cliente. El valor predeterminado es 8443. | No |
Tipo de autenticación | Mecanismo de autenticación utilizado para conectarse al servidor de Presto. Los valores permitidos son: Anonymous y LDAP |
Sí |
nombre de usuario | Nombre de usuario que se usa para conectarse al servidor de Presto. | No |
contraseña | Contraseña que corresponde al nombre de usuario. Marque este campo como SecureString para almacenarlo de forma segura, o bien haga referencia a un secreto almacenado en Azure Key Vault. | No |
habilitarSsl | Especifica si las conexiones al servidor se cifran mediante TLS. El valor predeterminado es true. | No |
enableServerCertificateValidation | Especifique si se va a habilitar la validación de certificados SSL de servidor al conectarse. Use siempre el Almacén de confianza del sistema. El valor predeterminado es true. |
No |
timeZoneID (identificador de zona horaria) | Zona horaria local que usa la conexión. Los valores válidos para esta opción se especifican en la base de datos de la zona horaria IANA. El valor predeterminado es la zona horaria del sistema Presto. | No |
Ejemplo:
{
"name": "PrestoLinkedService",
"properties": {
"type": "Presto",
"version" : "2.0",
"typeProperties": {
"host" : "<host>",
"catalog" : "<catalog>",
"port" : 8443,
"authenticationType" : "LDAP",
"username" : "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
},
"enableSsl": true,
"enableServerCertificateValidation": true,
"timeZoneID" : ""
}
}
}
Versión 1.0
El servicio vinculado de Presto admite las siguientes propiedades cuando se aplica la versión 1.0:
Propiedad | Descripción | Obligatorio |
---|---|---|
tipo | La propiedad type debe establecerse en: Presto | Sí |
anfitrión | Dirección IP o nombre de host del servidor de Presto. (por ejemplo, 192.168.222.160) | Sí |
Versión del servidor | Versión del servidor de Presto. (por ejemplo, 0.148-t) | Sí |
catálogo | Contexto de catálogo para todas las solicitudes en el servidor. | Sí |
puerto | Puerto TCP que el servidor de Presto utiliza para escuchar las conexiones del cliente. El valor predeterminado es 8080. | No |
Tipo de autenticación | Mecanismo de autenticación utilizado para conectarse al servidor de Presto. Los valores permitidos son: Anonymous y LDAP |
Sí |
nombre de usuario | Nombre de usuario que se usa para conectarse al servidor de Presto. | No |
contraseña | Contraseña que corresponde al nombre de usuario. Marque este campo como SecureString para almacenarlo de forma segura, o bien haga referencia a un secreto almacenado en Azure Key Vault. | No |
habilitarSsl | Especifica si las conexiones al servidor se cifran mediante TLS. El valor predeterminado es false. | No |
trustedCertPath | Ruta de acceso completa del archivo .pem que contiene certificados de CA de confianza para comprobar el servidor al conectarse a través de TLS. Esta propiedad solo puede establecerse al utilizar TLS en IR autohospedados. El valor predeterminado es el archivo cacerts.pem instalado con el IR. | No |
useSystemTrustStore | Especifica si se utiliza un certificado de CA del almacén de confianza del sistema o de un archivo PEM especificado. El valor predeterminado es false. | No |
allowHostNameCNMismatch | Especifica si se requiere que el nombre del certificado TLS/SSL emitido por una CA coincida con el nombre de host del servidor al conectarse a través de TLS. El valor predeterminado es false. | No |
allowSelfSignedServerCert | Especifica si se permiten los certificados autofirmados del servidor. El valor predeterminado es false. | No |
timeZoneID (identificador de zona horaria) | Zona horaria local que usa la conexión. Los valores válidos para esta opción se especifican en la base de datos de la zona horaria IANA. El valor predeterminado es la zona horaria de Azure Data Factory. | No |
Ejemplo:
{
"name": "PrestoLinkedService",
"properties": {
"type": "Presto",
"typeProperties": {
"host" : "<host>",
"serverVersion" : "0.148-t",
"catalog" : "<catalog>",
"port" : "<port>",
"authenticationType" : "LDAP",
"username" : "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
},
"timeZoneID" : "Europe/Berlin"
}
}
}
Propiedades del conjunto de datos
Si desea ver una lista completa de las secciones y propiedades disponibles para definir conjuntos de datos, consulte el artículo sobre conjuntos de datos. En esta sección se proporciona una lista de las propiedades compatibles con el conjunto de datos de Presto.
Para copiar datos de Presto, establezca la propiedad type del conjunto de datos en PrestoObject. Se admiten las siguientes propiedades:
Propiedad | Descripción | Obligatorio |
---|---|---|
tipo | La propiedad type del conjunto de datos debe establecerse en: PrestoObject | Sí |
esquema | Nombre del esquema. | No (si se especifica "query" en el origen de la actividad) |
tabla | Nombre de la tabla. | No (si se especifica "query" en el origen de la actividad) |
tableName | Nombre de la tabla con el esquema. Esta propiedad permite la compatibilidad con versiones anteriores. Use schema y table para la carga de trabajo nueva. |
No (si se especifica "query" en el origen de la actividad) |
Ejemplo
{
"name": "PrestoDataset",
"properties": {
"type": "PrestoObject",
"typeProperties": {},
"schema": [],
"linkedServiceName": {
"referenceName": "<Presto linked service name>",
"type": "LinkedServiceReference"
}
}
}
Propiedades de la actividad de copia
Si desea ver una lista completa de las secciones y propiedades disponibles para definir actividades, consulte el artículo sobre canalizaciones. En esta sección se proporciona una lista de las propiedades compatibles con el origen de Presto.
Presto como origen
Para copiar datos de Presto, establezca el tipo de origen de la actividad de copia en PrestoSource. Se admiten las siguientes propiedades en la sección source de la actividad de copia:
Propiedad | Descripción | Obligatorio |
---|---|---|
tipo | La propiedad type del origen de la actividad de copia debe establecerse en: PrestoSource | Sí |
Query | Use la consulta SQL personalizada para leer los datos. Por ejemplo: "SELECT * FROM MyTable" . |
No (si se especifica "tableName" en el conjunto de datos) |
Ejemplo:
"activities":[
{
"name": "CopyFromPresto",
"type": "Copy",
"inputs": [
{
"referenceName": "<Presto input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "PrestoSource",
"query": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
Asignación de tipos de datos para Presto
Al copiar datos de Teradata, se aplican las siguientes asignaciones de los tipos de datos de Teradata a los tipos de datos internos utilizados por el servicio. Para más información acerca de la forma en que la actividad de copia asigna el tipo de datos y el esquema de origen al receptor, consulte el artículo sobre asignaciones de tipos de datos y esquema.
Tipo de datos Presto | Tipo de datos de servicio provisional (para la versión 2.0) | Tipo de datos de servicio provisional (para la versión 1.0) |
---|---|---|
ARREGLO | Cuerda | Cuerda |
bigint | Int64 | Int64 |
BOOLEANO | Booleano | Booleano |
CARBONIZAR | Cuerda | Cuerda |
FECHA | Fecha | Fecha y hora |
DECIMAL (Precisión < 28) | Decimal | Decimal |
DECIMAL (Precisión >= 28) | Decimal | Cuerda |
DOBLE | Doble | Doble |
ENTERO | Int32 | Int32 |
INTERVAL_DAY_TO_SECOND | TimeSpan | No está soportado. |
INTERVALO_AÑO_A_MES | Cuerda | No está soportado. |
IPADDRESS | Cuerda | No está soportado. |
JSON | Cuerda | Cuerda |
MAPA | Cuerda | Cuerda |
REAL | Soltero | Soltero |
FILA | Cuerda | Cuerda |
SMALLINT | Int16 | Int16 |
TIEMPO | Tiempo | TimeSpan |
TIME_WITH_TIME_ZONE | Cuerda | Cuerda |
TIMESTAMP | Fecha y hora | Fecha y hora |
TIMESTAMPWITHTIMEZONE | Datetimeoffset | No está soportado. |
TINYINT | SByte | Int16 |
Identificador Único Universal (UUID) | GUID | No está soportado. |
VARBINARY | Byte[] | Byte[] |
VARCHAR | Cuerda | Cuerda |
Propiedades de la actividad de búsqueda
Para obtener información detallada sobre las propiedades, consulte Actividad de búsqueda.
Actualización del conector de Presto
Estos son los pasos que le ayudarán a actualizar el conector de Presto:
En la página Editar servicio vinculado , seleccione la versión 2.0 y configure el servicio vinculado haciendo referencia a las propiedades de la versión 2.0 del servicio vinculado.
La asignación de tipos de datos para la versión 2.0 del servicio vinculado de Presto es diferente de la de la versión 1.0. Para obtener información sobre la asignación de tipos de datos más reciente, consulte Asignación de tipos de datos para Spark.
Diferencias entre la versión 2.0 del conector de Presto y la versión 1.0
La versión 2.0 del conector de Presto ofrece nuevas funcionalidades y es compatible con la mayoría de las características de la versión 1.0. En la tabla siguiente se muestran las diferencias de características entre la versión 2.0 y la versión 1.0.
Versión 2.0 | Versión 1.0 |
---|---|
No se admite serverVersion . |
serverVersion es compatible. |
El valor predeterminado de port es 8443. |
El valor predeterminado de port es 8080. |
El valor predeterminado de enableSSL es verdadero.enableServerCertificateValidation es compatible. No se admiten trustedCertPath , useSystemTrustStore , allowHostNameCNMismatch ni allowSelfSignedServerCert . |
El valor predeterminado de enableSSL es falso.No se admite enableServerCertificateValidation . trustedCertPath , useSystemTrustStore , allowHostNameCNMismatch y allowSelfSignedServerCert se admite. |
El valor predeterminado de timeZoneID es la zona horaria del sistema Presto. |
El valor predeterminado de timeZoneID es la zona horaria de Azure Data Factory. |
Las asignaciones siguientes se usan de tipos de datos de Presto al tipo de datos provisional del servicio. DATE -> Fecha DECIMAL (Precisión >= 28) -> Decimal INTERVAL_DAY_TO_SECOND:> TimeSpan INTERVAL_YEAR_TO_MONTH -> Cadena IPADDRESS -> cadena TIME -> Hora TIMESTAMPWITHTIMEZONE-> Datetimeoffset TINYINT:> SByte UUID:> GUID |
Las asignaciones siguientes se usan de tipos de datos de Presto al tipo de datos provisional del servicio. DATE -> Fecha y hora DECIMAL (Precisión >= 28):> cadena TIME -> Hora TINYINT -> Int16 Otras asignaciones admitidas por la versión 2.0 enumeradas a la izquierda no son compatibles con la versión 1.0. |
Contenido relacionado
Para obtener una lista de los almacenes de datos que admite la actividad de copia como orígenes y receptores, consulte Almacenes de datos compatibles.