Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Zwraca najlepszą migawkę plików tworzących tę ramkę danych. Ta metoda po prostu pyta każdego składnika BaseRelation o odpowiednie pliki i przyjmuje związek wszystkich wyników. W zależności od relacji źródłowych może to nie znajdować wszystkich plików wejściowych. Duplikaty są usuwane.
Składnia
inputFiles()
Zwroty
lista: lista ścieżek plików.
Examples
import os
import tempfile
with tempfile.TemporaryDirectory(prefix="inputFiles") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).repartition(1).write.json(d, mode="overwrite")
df = spark.read.format("json").load(d)
if os.environ.get('PYTEST_DBCONNECT_MODE') is None:
len(df.inputFiles())
else:
1 # dbconnect doesn't support inputFiles.
# 1