Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ładuje dane ze źródła danych i zwraca je jako DataFrame.
Składnia
load(path=None, format=None, schema=None, **options)
Parametry
| Parameter | Typ | Opis |
|---|---|---|
path |
str lub list, opcjonalnie | Co najmniej jedna ścieżka w źródle danych opartym na systemie plików. |
format |
str, opcjonalnie | Format źródła danych. Wartość domyślna to 'parquet'. |
schema |
Typ struktury lub str, opcjonalny | Schemat wejściowy jako StructType obiekt lub ciąg w formacie DDL (na przykład 'col0 INT, col1 DOUBLE'). |
**options |
słownik | Dodatkowe opcje ciągów. |
Zwroty
DataFrame
Examples
Załaduj plik CSV z określonym formatem, schematem i opcjami.
import tempfile
with tempfile.TemporaryDirectory(prefix="load") as d:
df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
df.write.option("header", True).mode("overwrite").format("csv").save(d)
df = spark.read.load(
d, schema=df.schema, format="csv", nullValue="Alice", header=True)
df.printSchema()
# root
# |-- age: long (nullable = true)
# |-- name: string (nullable = true)
df.show()
# +---+----+
# |age|name|
# +---+----+
# |100|NULL|
# +---+----+