Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Guarda el contenido de en DataFrame un origen de datos. El origen de datos se especifica mediante format y un conjunto de options. Si format no se especifica, se usa el origen de datos predeterminado configurado por spark.sql.sources.default .
Sintaxis
save(path=None, format=None, mode=None, partitionBy=None, **options)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
path |
str, opcional | Ruta de acceso en un sistema de archivos compatible con Hadoop. |
format |
str, opcional | Formato que se usa para guardar. |
mode |
str, opcional | Comportamiento cuando ya existen datos. Los valores aceptados son 'append', 'overwrite', 'ignore'y 'error' o 'errorifexists' (valor predeterminado). |
partitionBy |
list, opcional | Nombres de columnas de creación de particiones. |
**options |
diccionario | Opciones de cadena adicionales. |
Devoluciones
Ninguno
Ejemplos
Escriba un DataFrame en un archivo JSON y vuelva a leerlo.
import tempfile
with tempfile.TemporaryDirectory(prefix="save") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).write.mode("overwrite").format("json").save(d)
spark.read.format('json').load(d).show()
# +---+------------+
# |age| name|
# +---+------------+
# |100|Alice|
# +---+------------+