orc (DataFrameWriter)

Menyimpan konten DataFrame dalam format ORC pada jalur yang ditentukan.

Sintaksis

orc(path, mode=None, partitionBy=None, compression=None)

Parameter-parameternya

Parameter Tipe Deskripsi
path str Jalur dalam sistem file yang didukung Hadoop.
mode str, opsional Perilaku ketika data sudah ada. Nilai yang diterima adalah 'append', , 'overwrite''ignore', dan 'error' atau 'errorifexists' (default).
partitionBy str atau daftar, opsional Nama kolom partisi.
compression str, opsional Codec kompresi yang akan digunakan.

Pengembalian Barang

Tidak

Examples

Tulis DataFrame ke dalam file ORC dan baca kembali.

import tempfile
with tempfile.TemporaryDirectory(prefix="orc") as d:
    spark.createDataFrame(
        [{"age": 100, "name": "Alice"}]
    ).write.orc(d, mode="overwrite")

    spark.read.format("orc").load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+