Oharra
Baimena behar duzu orria atzitzeko. Direktorioetan saioa has dezakezu edo haiek alda ditzakezu.
Baimena behar duzu orria atzitzeko. Direktorioak alda ditzakezu.
Carga un flujo de datos desde un origen de datos y lo devuelve como dataFrame.
Sintaxis
load(path=None, format=None, schema=None, **options)
Parámetros
| Parámetro | Tipo | Descripción |
|---|---|---|
path |
str, opcional | Ruta de acceso para orígenes de datos respaldados por el sistema de archivos. |
format |
str, opcional | Formato del origen de datos. Tiene como valor predeterminado 'parquet'. |
schema |
StructType o str, opcional | Esquema de los datos de entrada como una cadena con formato StructType o DDL (por ejemplo, col0 INT, col1 DOUBLE). |
**options |
Todas las demás opciones de cadena. |
Devoluciones
DataFrame
Ejemplos
Cargue una secuencia desde un archivo JSON temporal:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="load") as d:
spark.createDataFrame(
[(100, "Hyukjin Kwon"),], ["age", "name"]
).write.mode("overwrite").format("json").save(d)
q = spark.readStream.schema(
"age INT, name STRING"
).format("json").load(d).writeStream.format("console").start()
time.sleep(3)
q.stop()