Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Возвращает оптимальный моментальный снимок файлов, составляющих этот кадр данных. Этот метод просто запрашивает каждый составляющий BaseRelation для соответствующих файлов и принимает объединение всех результатов. В зависимости от исходных отношений это может не находить все входные файлы. Дубликаты удаляются.
Синтаксис
inputFiles()
Возвраты
список путей к файлу.
Примеры
import os
import tempfile
with tempfile.TemporaryDirectory(prefix="inputFiles") as d:
spark.createDataFrame(
[{"age": 100, "name": "Alice"}]
).repartition(1).write.json(d, mode="overwrite")
df = spark.read.format("json").load(d)
if os.environ.get('PYTEST_DBCONNECT_MODE') is None:
len(df.inputFiles())
else:
1 # dbconnect doesn't support inputFiles.
# 1