Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
CSV dosyasını yükler ve sonucu olarak DataFramedöndürür. Etkinleştirilirse inferSchema , bu işlev şemayı belirlemek için girişi bir kez okur. Bunu önlemek için, kullanarak inferSchemaşemayı açıkça devre dışı bırakın schema veya belirtin.
Sözdizimi
csv(path, schema=None, **options)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
path |
str veya list | Bir veya daha fazla giriş yolu veya CSV satırlarını depolanan dizelerin RDD'sini. |
schema |
StructType veya str, isteğe bağlı | Nesne olarak isteğe bağlı giriş StructType şeması veya DDL biçimli dize (örneğin, 'col0 INT, col1 DOUBLE'). |
İadeler
DataFrame
Örnekler
Bir CSV dosyasına DataFrame yazın ve yeniden okuyun.
import tempfile
with tempfile.TemporaryDirectory(prefix="csv") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.mode("overwrite").format("csv").save(d)
spark.read.csv(d, schema=df.schema, nullValue="Alice").show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+