csv (DataStreamReader)

Ładuje strumień plików CSV i zwraca wynik jako ramkę danych. Jeśli inferSchema jest włączona, funkcja przechodzi przez dane wejściowe raz w celu określenia schematu. Aby uniknąć tego przekazywania, wyłącz inferSchema lub określ schemat jawnie przy użyciu polecenia schema.

Składnia

csv(path, schema=None, **options)

Parametry

Parameter Typ Opis
path str Ścieżka dla danych wejściowych CSV.
schema Typ struktury lub str, opcjonalny Schemat jako ciąg w formacie StructType lub DDL (na przykład col0 INT, col1 DOUBLE).

Zwroty

DataFrame

Examples

Załaduj strumień z tymczasowego pliku CSV:

import tempfile
import time
with tempfile.TemporaryDirectory(prefix="csv") as d:
    spark.createDataFrame([(1, "2"),]).write.mode("overwrite").format("csv").save(d)
    q = spark.readStream.schema(
        "col0 INT, col1 STRING"
    ).format("csv").load(d).writeStream.format("console").start()
    time.sleep(3)
    q.stop()