csv (DataFrameReader)

Memuat file CSV dan mengembalikan hasilnya sebagai DataFrame. Jika inferSchema diaktifkan, fungsi ini membaca input sekali untuk menentukan skema. Untuk menghindari hal ini, nonaktifkan inferSchema atau tentukan skema secara eksplisit menggunakan schema.

Sintaksis

csv(path, schema=None, **options)

Parameter-parameternya

Parameter Tipe Deskripsi
path str atau daftar Satu atau beberapa jalur input, atau RDD string yang menyimpan baris CSV.
schema StructType atau str, opsional Skema input opsional sebagai StructType objek atau string berformat DDL (misalnya, 'col0 INT, col1 DOUBLE').

Pengembalian Barang

DataFrame

Examples

Tulis DataFrame ke dalam file CSV dan baca kembali.

import tempfile
with tempfile.TemporaryDirectory(prefix="csv") as d:
    df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
    df.write.mode("overwrite").format("csv").save(d)

    spark.read.csv(d, schema=df.schema, nullValue="Alice").show()
    # +---+----+
    # |age|name|
    # +---+----+
    # |100|NULL|
    # +---+----+