Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Metin dosyalarını yükler ve şeması adlı DataFramebir dize sütunuyla başlayan ve varsa bölümlenmiş sütunlar içeren bir value döndürür. Metin dosyaları UTF-8 olarak kodlanmalıdır. Varsayılan olarak, metin dosyasındaki her satır, sonuçta elde edilen DataFrame'de yeni bir satırdır.
Sözdizimi
text(paths, wholetext=False, lineSep=None, **options)
Parametreler
| Parametre | Türü | Açıklama |
|---|---|---|
paths |
str veya list | Bir veya daha fazla giriş yolu. |
wholetext |
bool, isteğe bağlı | ise True, her dosyayı tek bir satır olarak okuyun. Varsayılan False değeridir. |
lineSep |
str, isteğe bağlı | Kullanılacak çizgi ayırıcı. Varsayılan olarak , '\n'veya '\r'şeklindedir'\r\n'. |
İadeler
DataFrame
Örnekler
Metin dosyasına DataFrame yazıp geri okuyun.
import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
df.write.mode("overwrite").format("text").save(d)
spark.read.schema(df.schema).text(d).sort("alphabets").show()
# +---------+
# |alphabets|
# +---------+
# | a|
# | b|
# | c|
# +---------+