skema (DataStreamReader)

Menentukan skema input. Beberapa sumber data (misalnya, JSON) dapat menyimpulkan skema input secara otomatis dari data. Menentukan skema di sini memungkinkan sumber data untuk melewati inferensi skema dan mempercepat pemuatan data.

Sintaksis

schema(schema)

Parameter-parameternya

Parameter Tipe Deskripsi
schema StructType atau str Objek StructType atau string berformat DDL (misalnya, col0 INT, col1 DOUBLE).

Pengembalian Barang

DataStreamReader

Examples

from pyspark.sql.types import StructField, StructType, StringType
spark.readStream.schema(StructType([StructField("data", StringType(), True)]))
# <...streaming.readwriter.DataStreamReader object ...>
spark.readStream.schema("col0 INT, col1 DOUBLE")
# <...streaming.readwriter.DataStreamReader object ...>

Tentukan skema yang berbeda untuk file CSV:

import tempfile
with tempfile.TemporaryDirectory(prefix="schema") as d:
    spark.readStream.schema("col0 INT, col1 STRING").format("csv").load(d).printSchema()
    # root
    #  |-- col0: integer (nullable = true)
    #  |-- col1: string (nullable = true)