Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Especifica el esquema de entrada. Algunos orígenes de datos (por ejemplo, JSON) pueden deducir automáticamente el esquema de entrada de los datos. Especificar el esquema aquí permite al origen de datos omitir la inferencia de esquemas y acelerar la carga de datos.
Sintaxis
schema(schema)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
schema |
StructType o str | Un objeto StructType o una cadena con formato DDL (por ejemplo, col0 INT, col1 DOUBLE). |
Devoluciones
DataStreamReader
Ejemplos
from pyspark.sql.types import StructField, StructType, StringType
spark.readStream.schema(StructType([StructField("data", StringType(), True)]))
# <...streaming.readwriter.DataStreamReader object ...>
spark.readStream.schema("col0 INT, col1 DOUBLE")
# <...streaming.readwriter.DataStreamReader object ...>
Especifique un esquema diferente para un archivo CSV:
import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
spark.readStream.schema("col0 INT, col1 STRING").format("csv").load(d).printSchema()
# root
# |-- col0: integer (nullable = true)
# |-- col1: string (nullable = true)