Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Temel alınan veri kaynağı için bir çıkış seçeneği ekler. Kullanılabilir seçeneklerden bazıları için bkz. Seçenekler.
Sözdizimi
option(key, value)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
key |
str | Seçenek tuşu. |
value |
str, int, float veya bool | Seçenek değeri. |
Options
Aşağıdaki tabloda bazı yazıcı seçenekleri yer alır:
| Key | Formats | Açıklama |
|---|---|---|
arrayElementName |
XML | Açık adı olmayan dizi öğelerinin öğe adı. Varsayılan: item.
Xml (DataFrameWriter) için geçerlidir. |
attributePrefix |
XML | Ön ek, XML özniteliklerine karşılık gelen alan adlarına eklenir. Varsayılan: _.
Xml (DataFrameWriter) için geçerlidir. |
avroSchema |
Avro | JSON dizesi olarak tam Avro şeması. Spark SQL türlerini belirli Avro türlerine dönüştürmek için bu seçeneği kullanın. Avro dosyası için geçerlidir. |
charToEscapeQuoteEscaping |
CSV | Tırnak karakterinden farklı olduğunda kaçış karakterinden kaçmak için kullanılan karakter. Varsayılan: \0 (etkin değil).
Csv (DataFrameWriter) için geçerlidir. |
clusterByAuto |
Delta Gölü | Azure Databricks sorgu desenlerine göre kümeleme sütunlarını seçtiği otomatik sıvı kümelemlerinin etkinleştirilip etkinleştirilmeyeceği. Yalnızca ile mode("overwrite")geçerlidir. Mod ile append kullanılamaz. Varsayılan: false. Databricks Runtime 16.4 ve üzerinde kullanılabilir.
Tablolar için sıvı kümeleme kullanma için geçerlidir. |
compression |
CSV, JSON, ORC, Parquet, Metin, XML | Yazarken kullanılacak sıkıştırma codec bileşeni. Geçerli değerler biçime göre değişir. Csv (DataFrameWriter), json (DataFrameWriter), orc (DataFrameWriter), parquet (DataFrameWriter), text (DataFrameWriter), xml (DataFrameWriter)için geçerlidir. |
dateFormat |
CSV, JSON, XML | Tarih sütunu değerleri için biçim dizesi. Varsayılan: yyyy-MM-dd.
Csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter) için geçerlidir. |
declaration |
XML | Her çıkış dosyasının en üstünde yazılan XML bildirim dizesi. Bildirimi engellemek için boş bir dizeye ayarlayın. Varsayılan: version="1.0" encoding="UTF-8" standalone="yes".
Xml (DataFrameWriter) için geçerlidir. |
emptyValue |
CSV | Boş (null olmayan) değerler için yazılan dize. Varsayılan: "".
Csv (DataFrameWriter) için geçerlidir. |
encoding |
CSV, JSON, XML | Çıkış dosyalarının karakter kodlaması. Varsayılan: UTF-8.
Csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter) için geçerlidir. |
escape |
CSV | Tırnak içine alınmış değerlerin kaçışı için kullanılan karakter. Varsayılan: \.
Csv (DataFrameWriter) için geçerlidir. |
escapeQuotes |
CSV | Tırnak içine alınmış alan değerlerinin içindeki çıkış tırnak işareti karakterleri olup olmadığı. Varsayılan: true.
Csv (DataFrameWriter) için geçerlidir. |
header |
CSV | Çıktının ilk satırı olarak sütun adlarının yazılıp yazılmayacağı. Varsayılan: false.
Csv (DataFrameWriter) için geçerlidir. |
ignoreLeadingWhiteSpace |
CSV | Yazarken değerlerden önde gelen boşluğun kırpılıp kırpılmayacağı. Varsayılan: false.
Csv (DataFrameWriter) için geçerlidir. |
ignoreNullFields |
JSON | JSON çıkışından null değerler içeren alanların atlanıp atılmayacağı. Varsayılan: değeri spark.sql.jsonGenerator.ignoreNullFields.
json (DataFrameWriter) için geçerlidir. |
ignoreTrailingWhiteSpace |
CSV | Yazarken değerlerden sondaki boşluğun kırpılıp kırpılmayacağı. Varsayılan: false.
Csv (DataFrameWriter) için geçerlidir. |
lineSep |
CSV, JSON, Metin | Kayıtlar arasında kullanılan satır ayırıcı dizesi. Varsayılan: \n.
Csv (DataFrameWriter), json (DataFrameWriter), metin (DataFrameWriter) için geçerlidir. |
mergeSchema |
Delta Gölü | Yazma işlemi için şema evriminin etkinleştirilip etkinleştirilmeyileceği. Kaynak DataFrame'deki yeni sütunlar hedef tablo şemasına eklenir. Toplu iş ve akış eklemeleri için geçerlidir. Tablo şemasını güncelleştirme için geçerlidir. |
nullValue |
CSV | Null değerler için yazılmış dize. Varsayılan: "".
Csv (DataFrameWriter) için geçerlidir. |
nullValue |
XML | Null değerler için yazılan dize. Varsayılan: null. olarak nullayarlandığında, null alanlar için öznitelikler ve alt öğeler atlanır.
Xml (DataFrameWriter) için geçerlidir. |
overwriteSchema |
Delta Gölü | Üzerine yazılırken tablo şemasının ve bölümlemenin değiştirilip değiştirilmeyeceği. olmadan replaceWheregerektirirmode("overwrite").
partitionOverwriteMode ile kullanılamaz.
Tablo şemasını güncelleştirme için geçerlidir. |
partitionOverwriteMode |
Delta Gölü | Bölüm üzerine yazma modu. Bunu, dynamic yalnızca yeni veri içeren bölümlerin üzerine yazacak şekilde ayarlayın ve diğer tüm bölümleri değiştirmeden bırakın. Eski mod; sunucusuz işlemde veya Databricks SQL'de desteklenmez.
Delta Lake ile verilerin üzerine seçmeli olarak yazma için geçerlidir. |
quote |
CSV | Ayırıcıyı içeren alan değerlerini tırnak içine almak için kullanılan karakter. Varsayılan: ".
Csv (DataFrameWriter) için geçerlidir. |
quoteAll |
CSV | İçeriklerden bağımsız olarak tüm alan değerlerinin tırnak içine alınıp alınmayacağı. Varsayılan: false.
Csv (DataFrameWriter) için geçerlidir. |
recordName |
Avro | Çıkış Avro şemasındaki en üst düzey kayıt adı. Varsayılan: topLevelRecord.
Avro dosyası için geçerlidir. |
recordNamespace |
Avro | Çıkış Avro şemasındaki en üst düzey kaydın ad alanı. Varsayılan: "".
Avro dosyası için geçerlidir. |
replaceWhere |
Delta Gölü | Koşul ifadesi. Atomik olarak yalnızca koşulla eşleşen kayıtların üzerine yazar. Delta Lake ile verilerin üzerine seçmeli olarak yazma için geçerlidir. |
rootTag |
XML | Çıktıdaki tüm satır öğelerini sarmalayan kök öğe etiketi. Varsayılan: ROWS.
Xml (DataFrameWriter) için geçerlidir. |
rowTag |
XML | Çıktıdaki bir satırı temsil eden öğe etiketi. Varsayılan: ROW.
Xml (DataFrameWriter) için geçerlidir. |
sep |
CSV | Alan sınırlayıcısı karakteri. Varsayılan: ,.
Csv (DataFrameWriter) için geçerlidir. |
timestampFormat |
CSV, JSON, XML | Zaman damgası sütun değerlerinin biçim dizesi. Varsayılan: yyyy-MM-dd'T'HH:mm:ss[.SSS][XXX].
Csv (DataFrameWriter), json (DataFrameWriter), xml (DataFrameWriter) için geçerlidir. |
txnAppId |
Delta Gölü | İşlemlerde foreachBatch etkili yazma işlemleri için uygulamayı tanımlayan benzersiz bir dize. Birden çok Delta Lake tablosuna tam olarak bir kez yazılmasını sağlamak için ile txnVersion birlikte kullanın.
Bir kez etkili tablo yazma işlemleri için kullanma foreachBatchiçin geçerlidir. |
txnVersion |
Delta Gölü | İşlemlerdeki foreachBatch tek etkili yazma işlemleri için işlem sürümü olarak kullanılan monoton olarak artan bir sayı. Birden çok Delta Lake tablosuna tam olarak bir kez yazılmasını sağlamak için ile txnAppId birlikte kullanın.
Bir kez etkili tablo yazma işlemleri için kullanma foreachBatchiçin geçerlidir. |
userMetadata |
Delta Gölü, Apache Iceberg | Yazma işlemi için işleme meta verilerine eklenen kullanıcı tanımlı bir dize. çıktısında DESCRIBE HISTORYgörünür.
Özel meta verilerle tabloları zenginleştirme için geçerlidir. |
validateName |
XML | Sütun adı geçerli bir XML öğesi tanımlayıcısı değilse özel durum oluşturup oluşturmayacağınız. Varsayılan: true.
Xml (DataFrameWriter) için geçerlidir. |
valueTag |
XML | Öznitelikleri veya alt öğeleri de olan XML öğelerindeki karakter verileri için kullanılan alan adı. Varsayılan: _VALUE.
Xml (DataFrameWriter) için geçerlidir. |
İadeler
DataFrameWriter
Örnekler
Seçenek ayarlanmış bir CSV dosyasına nullValue DataFrame yazın.
import tempfile
with tempfile.TemporaryDirectory(prefix="option") as d:
df = spark.createDataFrame([(100, None)], "age INT, name STRING")
df.write.option("nullValue", "Alice").mode("overwrite").format("csv").save(d)
spark.read.schema(df.schema).format('csv').load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+