Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ładuje strumień plików CSV i zwraca wynik jako ramkę danych. Jeśli inferSchema jest włączona, funkcja przechodzi przez dane wejściowe raz w celu określenia schematu. Aby uniknąć tego przekazywania, wyłącz inferSchema lub określ schemat jawnie przy użyciu polecenia schema.
Składnia
csv(path, schema=None, **options)
Parametry
| Parameter | Typ | Opis |
|---|---|---|
path |
str | Ścieżka dla danych wejściowych CSV. |
schema |
Typ struktury lub str, opcjonalny | Schemat jako ciąg w formacie StructType lub DDL (na przykład col0 INT, col1 DOUBLE). |
Zwroty
DataFrame
Examples
Załaduj strumień z tymczasowego pliku CSV:
import tempfile
import time
with tempfile.TemporaryDirectory(prefix="csv") as d:
spark.createDataFrame([(1, "2"),]).write.mode("overwrite").format("csv").save(d)
q = spark.readStream.schema(
"col0 INT, col1 STRING"
).format("csv").load(d).writeStream.format("console").start()
time.sleep(3)
q.stop()