csv (DataStreamReader)

Ładuje strumień plików CSV i zwraca wynik jako ramkę danych. Jeśli inferSchema jest włączona, funkcja przechodzi przez dane wejściowe raz w celu określenia schematu. Aby uniknąć tego przekazywania, wyłącz inferSchema lub określ schemat jawnie przy użyciu polecenia schema.

Składnia

csv(path, schema=None, **options)

Parametry

Parameter	Typ	Opis
`path`	str	Ścieżka dla danych wejściowych CSV.
`schema`	Typ struktury lub str, opcjonalny	Schemat jako ciąg w formacie StructType lub DDL (na przykład `col0 INT, col1 DOUBLE`).

Zwroty

DataFrame

Examples

Załaduj strumień z tymczasowego pliku CSV:

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="csv") as d:
    spark.createDataFrame([(1, "2"),]).write.mode("overwrite").format("csv").save(d)
    q = spark.readStream.schema(
        "col0 INT, col1 STRING"
    ).format("csv").load(d).writeStream.format("console").start()
    time.sleep(3)
    q.stop()

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-19