Поделиться через


input_file_name

Создает строковый столбец для имени файла текущей задачи Spark.

Синтаксис

from pyspark.sql import functions as sf

sf.input_file_name()

Возвраты

pyspark.sql.Column: имена файлов.

Примеры

Пример 1. Получение имени входного файла

import os
from pyspark.sql import functions as sf
path = os.path.abspath(__file__)
df = spark.read.text(path)
df.select(sf.input_file_name()).first()
Row(input_file_name()='file:/...')