Nota
L'accés a aquesta pàgina requereix autorització. Podeu provar d'iniciar la sessió o de canviar els directoris.
L'accés a aquesta pàgina requereix autorització. Podeu provar de canviar els directoris.
En esta página se enumeran las limitaciones al usar el conector De ingesta de Zerobus en Lakeflow Connect.
Availability
El conector De ingesta de Zerobus está disponible en las siguientes regiones:
westuswestus2westus3eastuseastus2centralusnorthcentralussouthcentraluscanadacentralbrazilsouthwesteuropenortheuropegermanywestcentralswedencentralswitzerlandnorthuksouthaustraliaeastcentralindiasoutheastasia
Todas las regiones disponibles proporcionan disponibilidad de servicio multizona, excepto para westus y northcentralus, que proporcionan disponibilidad de zona única.
Latencia
La latencia refleja tanto la confirmación de durabilidad como el tiempo para materializar los registros en la tabla Delta de destino. Los tiempos reales varían en función de la alineación de regiones y las características de la carga de trabajo.
- Tiempo de durabilidad
- P95 ≤ 500 ms
- P50 ≤ 200 ms
- Tiempo hasta la presentación
- P95 ≤ 30 segundos
- P50 ≤ 5 segundos
Restricciones de rendimiento
- 100 MB/segundo por secuencia (evaluado usando mensajes de tamaño de 1 KB)
- 10 GB/segundo por tabla objetivo
- 15,000 registros por segundo por flujo
Para lograr el rendimiento máximo, una aplicación cliente y un punto de conexión deben estar en la misma región geográfica. Si necesita un mayor rendimiento, póngase en contacto con el representante de la cuenta de Databricks.
Garantías de entrega
El conector de ingesta de Zerobus solo proporciona garantías de entrega al menos una vez.
Cuotas
A continuación se muestran las cuotas predeterminadas para el conector de Ingesta Zerobus. Si necesita un mayor rendimiento, póngase en contacto con su representante de la cuenta de Databricks.
gRPC
- Rendimiento de 100 MB por segundo por flujo
- Rendimiento de 10 GB por segundo por tabla de destino
REST
- 10 000 solicitudes por segundo
Tablas particionadas
Al escribir en tablas con particiones, el conector Zerobus Ingest no admite la escritura en más de 1000 particiones en intervalos de 5 segundos.
Confirmaciones administradas por el catálogo
Zerobus Ingest no admite confirmaciones gestionadas por catálogos. No utilice la ingesta de Zerobus para tablas Delta con las confirmaciones gestionadas por el catálogo habilitadas.
Área de trabajo y tabla objetivo
Se requieren las siguientes condiciones de área de trabajo y tabla de destino para la ingesta.
- El conector solo admite la escritura en tablas Delta administradas. No se admite la escritura en el almacenamiento predeterminado.
- El conector no admite la escritura en el almacenamiento protegido a través de un punto de conexión privado.
- El conector no admite la recreación de una tabla de destino.
- El conector solo admite nombres de tabla con letras ASCII, dígitos y caracteres de subrayado.
- Tanto el área de trabajo como la tabla de destino deben estar en una de las regiones disponibles, y ambas deben estar en la misma región.
Tablas en clúster liquidas
Importante
Escribir en tablas en clúster líquido mediante el conector de Ingesta de Zerobus está en Beta.
Al usar el conector de Ingesta de Zerobus con tablas agrupadas de tipo líquido, se recomienda mantener habilitada la optimización predictiva para la tabla de destino. El conector escribe datos en la tabla, pero el servicio de optimización predictiva aplica la agrupación en clústeres de datos óptimos de forma asincrónica. Deshabilitar la optimización predictiva puede dar lugar a un rendimiento de consulta poco óptimo en los datos ingeridos.
Áreas de trabajo del perfil de seguridad de cumplimiento
El conector de ingesta de Zerobus no se admite para espacios de trabajo con perfiles de seguridad para el cumplimiento (como FedRAMP, HIPAA y PCI-DSS). No utilice el conector de ingesta de Zerobus para tareas que requieran garantías de cumplimiento. Para obtener una lista de los estándares y programas de cumplimiento admitidos, consulte Perfil de seguridad de cumplimiento.
Evolución del esquema
Zerobus Ingest nunca evolucionará automáticamente la tabla de destino.
Zerobus Ingest soporta la ingesta continua cuando se agregan columnas Delta anulables a la tabla de destino. Las columnas que faltan se rellenan con NULL valores, lo que permite enviar registros con campos que faltan.
Esquema Protobuf
La definición del esquema protobuf debe coincidir en una correspondencia 1:1 con el esquema de la tabla Delta (excepto las columnas delta adicionales que aceptan valores nulos, que se consideran un cambio de esquema no disruptivo). Si el esquema no coincide, la API devuelve un error. Esto incluye:
Número diferente de columnas
Nombres de columna diferentes
Opcionalidad de columna diferente (que acepta valores NULL y no acepta valores NULL)
El conector no admite esquemas proto con más de 2000 columnas.
El conector solo admite nombres de tabla y columna con letras ASCII, dígitos y caracteres de subrayado.
El conector no admite el uso de un esquema proto diferente para las operaciones de "creación de flujos" y "registro de ingesta".
Tamaño del registro
Cada mensaje está limitado a 10 MB. El tamaño máximo del registro es de 10 485 760 bytes. Los encabezados necesarios para la comunicación ocupan 19 bytes.
Soporte para tipos
En la tabla siguiente se muestran los tipos Delta admitidos y sus correspondientes tipos Protobuf para la ingesta de datos.
| Tipos delta | Tipos de Protobuf |
|---|---|
INTEGER |
int32 |
STRING |
string |
FLOAT |
float |
LONG |
int64 |
SHORT |
int32 |
DOUBLE |
double |
BOOLEAN |
bool |
BINARY |
bytes |
DATEDebe convertirse en int32 (número de días desde la época). |
int32 |
TIMESTAMPDebe convertirse a int64 (tiempo epoch en microsegundos). |
int64 |
ARRAY<TYPE> |
repeated TYPE |
MAP<K,V> |
map<K,V>El map azúcar sintáctica de Protobuf solo está disponible para compiladores Protobuf versión 3 y posteriores. |
STRUCT<FIELDS> |
message Nested { FIELDS } |
VARIANTLa variante debe ingerirse como una cadena codificada en JSON con claves de tipo STRING. El conector escribe los datos sin fragmentar en la columna.Entre los formatos de archivos admitidos se incluyen:
|
string |