option (DataFrameWriter)

Temel alınan veri kaynağı için bir çıkış seçeneği ekler. Kullanılabilir seçeneklerden bazıları için bkz. Seçenekler.

Sözdizimi

option(key, value)

Parametreler

Parametre Türü Açıklama
key str Seçenek tuşu.
value str, int, float veya bool Seçenek değeri.

Options

Aşağıdaki tabloda bazı yazıcı seçenekleri yer alır:

Key Formats Açıklama
arrayElementName XML Açık adı olmayan dizi öğelerinin öğe adı. Varsayılan: item. Xml (DataFrameWriter) için geçerlidir.
attributePrefix XML Ön ek, XML özniteliklerine karşılık gelen alan adlarına eklenir. Varsayılan: _. Xml (DataFrameWriter) için geçerlidir.
avroSchema Avro JSON dizesi olarak tam Avro şeması. Spark SQL türlerini belirli Avro türlerine dönüştürmek için bu seçeneği kullanın. Avro dosyası için geçerlidir.
charToEscapeQuoteEscaping CSV Tırnak karakterinden farklı olduğunda kaçış karakterinden kaçmak için kullanılan karakter. Varsayılan: \0 (etkin değil). Csv (DataFrameWriter) için geçerlidir.
clusterByAuto Delta Gölü Azure Databricks sorgu desenlerine göre kümeleme sütunlarını seçtiği otomatik sıvı kümelemlerinin etkinleştirilip etkinleştirilmeyeceği. Yalnızca ile mode("overwrite")geçerlidir. Mod ile append kullanılamaz. Varsayılan: false. Databricks Runtime 16.4 ve üzerinde kullanılabilir. Tablolar için sıvı kümeleme kullanma için geçerlidir.
compression CSV, JSON, ORC, Parquet, Metin, XML Yazarken kullanılacak sıkıştırma codec bileşeni. Geçerli değerler biçime göre değişir. Csv (DataFrameWriter), json (DataFrameWriter), orc (DataFrameWriter), parquet (DataFrameWriter), text (DataFrameWriter), xml (DataFrameWriter)için geçerlidir.
dateFormat CSV, JSON, XML Tarih sütunu değerleri için biçim dizesi. Varsayılan: yyyy-MM-dd. Csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter) için geçerlidir.
declaration XML Her çıkış dosyasının en üstünde yazılan XML bildirim dizesi. Bildirimi engellemek için boş bir dizeye ayarlayın. Varsayılan: version="1.0" encoding="UTF-8" standalone="yes". Xml (DataFrameWriter) için geçerlidir.
emptyValue CSV Boş (null olmayan) değerler için yazılan dize. Varsayılan: "". Csv (DataFrameWriter) için geçerlidir.
encoding CSV, JSON, XML Çıkış dosyalarının karakter kodlaması. Varsayılan: UTF-8. Csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter) için geçerlidir.
escape CSV Tırnak içine alınmış değerlerin kaçışı için kullanılan karakter. Varsayılan: \. Csv (DataFrameWriter) için geçerlidir.
escapeQuotes CSV Tırnak içine alınmış alan değerlerinin içindeki çıkış tırnak işareti karakterleri olup olmadığı. Varsayılan: true. Csv (DataFrameWriter) için geçerlidir.
header CSV Çıktının ilk satırı olarak sütun adlarının yazılıp yazılmayacağı. Varsayılan: false. Csv (DataFrameWriter) için geçerlidir.
ignoreLeadingWhiteSpace CSV Yazarken değerlerden önde gelen boşluğun kırpılıp kırpılmayacağı. Varsayılan: false. Csv (DataFrameWriter) için geçerlidir.
ignoreNullFields JSON JSON çıkışından null değerler içeren alanların atlanıp atılmayacağı. Varsayılan: değeri spark.sql.jsonGenerator.ignoreNullFields. json (DataFrameWriter) için geçerlidir.
ignoreTrailingWhiteSpace CSV Yazarken değerlerden sondaki boşluğun kırpılıp kırpılmayacağı. Varsayılan: false. Csv (DataFrameWriter) için geçerlidir.
lineSep CSV, JSON, Metin Kayıtlar arasında kullanılan satır ayırıcı dizesi. Varsayılan: \n. Csv (DataFrameWriter), json (DataFrameWriter), metin (DataFrameWriter) için geçerlidir.
mergeSchema Delta Gölü Yazma işlemi için şema evriminin etkinleştirilip etkinleştirilmeyileceği. Kaynak DataFrame'deki yeni sütunlar hedef tablo şemasına eklenir. Toplu iş ve akış eklemeleri için geçerlidir. Tablo şemasını güncelleştirme için geçerlidir.
nullValue CSV Null değerler için yazılmış dize. Varsayılan: "". Csv (DataFrameWriter) için geçerlidir.
nullValue XML Null değerler için yazılan dize. Varsayılan: null. olarak nullayarlandığında, null alanlar için öznitelikler ve alt öğeler atlanır. Xml (DataFrameWriter) için geçerlidir.
overwriteSchema Delta Gölü Üzerine yazılırken tablo şemasının ve bölümlemenin değiştirilip değiştirilmeyeceği. olmadan replaceWheregerektirirmode("overwrite"). partitionOverwriteMode ile kullanılamaz. Tablo şemasını güncelleştirme için geçerlidir.
partitionOverwriteMode Delta Gölü Bölüm üzerine yazma modu. Bunu, dynamic yalnızca yeni veri içeren bölümlerin üzerine yazacak şekilde ayarlayın ve diğer tüm bölümleri değiştirmeden bırakın. Eski mod; sunucusuz işlemde veya Databricks SQL'de desteklenmez. Delta Lake ile verilerin üzerine seçmeli olarak yazma için geçerlidir.
quote CSV Ayırıcıyı içeren alan değerlerini tırnak içine almak için kullanılan karakter. Varsayılan: ". Csv (DataFrameWriter) için geçerlidir.
quoteAll CSV İçeriklerden bağımsız olarak tüm alan değerlerinin tırnak içine alınıp alınmayacağı. Varsayılan: false. Csv (DataFrameWriter) için geçerlidir.
recordName Avro Çıkış Avro şemasındaki en üst düzey kayıt adı. Varsayılan: topLevelRecord. Avro dosyası için geçerlidir.
recordNamespace Avro Çıkış Avro şemasındaki en üst düzey kaydın ad alanı. Varsayılan: "". Avro dosyası için geçerlidir.
replaceWhere Delta Gölü Koşul ifadesi. Atomik olarak yalnızca koşulla eşleşen kayıtların üzerine yazar. Delta Lake ile verilerin üzerine seçmeli olarak yazma için geçerlidir.
rootTag XML Çıktıdaki tüm satır öğelerini sarmalayan kök öğe etiketi. Varsayılan: ROWS. Xml (DataFrameWriter) için geçerlidir.
rowTag XML Çıktıdaki bir satırı temsil eden öğe etiketi. Varsayılan: ROW. Xml (DataFrameWriter) için geçerlidir.
sep CSV Alan sınırlayıcısı karakteri. Varsayılan: ,. Csv (DataFrameWriter) için geçerlidir.
timestampFormat CSV, JSON, XML Zaman damgası sütun değerlerinin biçim dizesi. Varsayılan: yyyy-MM-dd'T'HH:mm:ss[.SSS][XXX]. Csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter) için geçerlidir.
txnAppId Delta Gölü İşlemlerde foreachBatch etkili yazma işlemleri için uygulamayı tanımlayan benzersiz bir dize. Birden çok Delta Lake tablosuna tam olarak bir kez yazılmasını sağlamak için ile txnVersion birlikte kullanın. Bir kez etkili tablo yazma işlemleri için kullanma foreachBatchiçin geçerlidir.
txnVersion Delta Gölü İşlemlerdeki foreachBatch tek etkili yazma işlemleri için işlem sürümü olarak kullanılan monoton olarak artan bir sayı. Birden çok Delta Lake tablosuna tam olarak bir kez yazılmasını sağlamak için ile txnAppId birlikte kullanın. Bir kez etkili tablo yazma işlemleri için kullanma foreachBatchiçin geçerlidir.
userMetadata Delta Gölü, Apache Iceberg Yazma işlemi için işleme meta verilerine eklenen kullanıcı tanımlı bir dize. çıktısında DESCRIBE HISTORYgörünür. Özel meta verilerle tabloları zenginleştirme için geçerlidir.
validateName XML Sütun adı geçerli bir XML öğesi tanımlayıcısı değilse özel durum oluşturup oluşturmayacağınız. Varsayılan: true. Xml (DataFrameWriter) için geçerlidir.
valueTag XML Öznitelikleri veya alt öğeleri de olan XML öğelerindeki karakter verileri için kullanılan alan adı. Varsayılan: _VALUE. Xml (DataFrameWriter) için geçerlidir.

İadeler

DataFrameWriter

Örnekler

Seçenek ayarlanmış bir CSV dosyasına nullValue DataFrame yazın.

import tempfile
with tempfile.TemporaryDirectory(prefix="option") as d:
    df = spark.createDataFrame([(100, None)], "age INT, name STRING")
    df.write.option("nullValue", "Alice").mode("overwrite").format("csv").save(d)

    spark.read.schema(df.schema).format('csv').load(d).show()
    # +---+------------+
    # |age|        name|
    # +---+------------+
    # |100|Alice|
    # +---+------------+