Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Utiliza la create_streaming_table() función en una canalización para crear una tabla de destino para los registros generados por operaciones de streaming realizadas, incluidas create_auto_cdc_flow(), create_auto_cdc_from_snapshot_flow() y registros de salida de append_flow.
Nota:
Las funciones create_target_table() y create_streaming_live_table() están en desuso. Databricks recomienda actualizar el código existente para usar la función create_streaming_table().
Syntax
from pyspark import pipelines as dp
dp.create_streaming_table(
name = "<table-name>",
comment = "<comment>",
spark_conf={"<key>" : "<value", "<key" : "<value>"},
table_properties={"<key>" : "<value>", "<key>" : "<value>"},
path="<storage-location-path>",
partition_cols=["<partition-column>", "<partition-column>"],
cluster_by_auto = <bool>,
cluster_by = ["<clustering-column>", "<clustering-column>"],
schema="schema-definition",
expect_all = {"<key>" : "<value", "<key" : "<value>"},
expect_all_or_drop = {"<key>" : "<value", "<key" : "<value>"},
expect_all_or_fail = {"<key>" : "<value", "<key" : "<value>"},
row_filter = "row-filter-clause"
)
Parámetros
| Parámetro | Tipo | Description |
|---|---|---|
name |
str |
Obligatorio. El nombre de la tabla. |
comment |
str |
Una descripción de la tabla. |
spark_conf |
dict |
Lista de configuraciones de Spark para la ejecución de esta consulta |
table_properties |
dict |
Una dict de las propiedades de la tabla para la tabla. |
path |
str |
Una ubicación de almacenamiento para los datos de tabla. Si no se establece, use la ubicación de almacenamiento administrada para el esquema que contiene la tabla. |
partition_cols |
list |
Lista de una o varias columnas que se van a usar para crear particiones en la tabla. |
cluster_by_auto |
bool |
Habilite la agrupación automática de líquidos en la tabla. Esto se puede combinar con cluster_by y definir las columnas que se van a usar como claves de agrupación en clústeres iniciales, seguidas de las actualizaciones de supervisión y selección automática de claves en función de la carga de trabajo. Consulte Agrupación automática de líquidos. |
cluster_by |
list |
Habilite la agrupación en clústeres líquidos en la tabla y defina las columnas que se usarán como claves de agrupación en clústeres. Consulte Uso de clústeres líquidos para tablas. |
schema |
str o StructType |
Definición de esquema para la tabla. Los esquemas se pueden definir como una cadena de DDL de SQL o con un StructType de Python. |
expect_all, , expect_all_or_drop, expect_all_or_fail |
dict |
Restricciones de calidad de datos para la tabla. Proporciona el mismo comportamiento y usa la misma sintaxis que las funciones de decorador de expectativas, pero se implementa como un parámetro. Consulte Expectativas. |
row_filter |
str |
(Versión preliminar pública) Una cláusula de filtro de fila para la tabla. Vea Publicación de tablas con filtros de fila y máscaras de columna. |