text (DataFrameReader)

Metin dosyalarını yükler ve şeması adlı DataFramebir dize sütunuyla başlayan ve varsa bölümlenmiş sütunlar içeren bir value döndürür. Metin dosyaları UTF-8 olarak kodlanmalıdır. Varsayılan olarak, metin dosyasındaki her satır, sonuçta elde edilen DataFrame'de yeni bir satırdır.

Sözdizimi

text(paths, wholetext=False, lineSep=None, **options)

Parametreler

Parametre Türü Açıklama
paths str veya list Bir veya daha fazla giriş yolu.
wholetext bool, isteğe bağlı ise True, her dosyayı tek bir satır olarak okuyun. Varsayılan False değeridir.
lineSep str, isteğe bağlı Kullanılacak çizgi ayırıcı. Varsayılan olarak , '\n'veya '\r'şeklindedir'\r\n'.

İadeler

DataFrame

Örnekler

Metin dosyasına DataFrame yazıp geri okuyun.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+