Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Carga archivos de texto y devuelve un DataFrame cuyo esquema comienza con una columna de cadena denominada value, seguida de columnas con particiones si hay alguna presente. Los archivos de texto se deben codificar como UTF-8. De forma predeterminada, cada línea del archivo de texto es una nueva fila en el dataframe resultante.
Sintaxis
text(paths, wholetext=False, lineSep=None, **options)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
paths |
str o list | Una o varias rutas de acceso de entrada. |
wholetext |
bool, opcional | Si Truees , lea cada archivo como una sola fila. El valor predeterminado es False. |
lineSep |
str, opcional | Separador de línea que se va a usar. El valor predeterminado es '\n', '\r'o '\r\n'. |
Devoluciones
DataFrame
Ejemplos
Escriba un DataFrame en un archivo de texto y vuelva a leerlo.
import tempfile
with tempfile.TemporaryDirectory(prefix="text") as d:
df = spark.createDataFrame([("a",), ("b",), ("c",)], schema=["alphabets"])
df.write.mode("overwrite").format("text").save(d)
spark.read.schema(df.schema).text(d).sort("alphabets").show()
# +---------+
# |alphabets|
# +---------+
# | a|
# | b|
# | c|
# +---------+