text (DataFrameReader)

Ładuje pliki tekstowe i zwraca schemat, którego DataFrame schemat rozpoczyna się od kolumny ciągu o nazwie value, a następnie kolumn podzielonych na partycje, jeśli istnieją. Pliki tekstowe muszą być zakodowane jako UTF-8. Domyślnie każdy wiersz w pliku tekstowym jest nowym wierszem w wynikowej ramce danych.

Składnia

text(paths, wholetext=False, lineSep=None, **options)

Parametry

Parameter Typ Opis
paths str lub list Co najmniej jedna ścieżka wejściowa.
wholetext wartość logiczna, opcjonalnie Jeśli Trueelement , odczytuje każdy plik jako pojedynczy wiersz. Wartość domyślna to False.
lineSep str, opcjonalnie Separator linii do użycia. Wartość domyślna to '\n', '\r'lub '\r\n'.

Zwroty

DataFrame

Examples

Zapisz ramkę danych w pliku tekstowym i odczytaj ją z powrotem.

import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
    df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
    df.write.mode("overwrite").format("text").save(d)

    spark.read.schema(df.schema).text(d).sort("alphabets").show()
    # +---------+
    # |alphabets|
    # +---------+
    # |        a|
    # |        b|
    # |        c|
    # +---------+