Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
Возвращает новый кадр данных, содержащий отдельные строки в этом кадре данных.
Синтаксис
distinct()
Возвраты
DataFrame: DataFrame с отдельными записями.
Примеры
df = spark.createDataFrame(
[(14, "Tom"), (23, "Alice"), (23, "Alice")], ["age", "name"])
df.distinct().show()
# +---+-----+
# |age| name|
# +---+-----+
# | 14| Tom|
# | 23|Alice|
# +---+-----+
df.distinct().count()
# 2
df = spark.createDataFrame(
[(14, "Tom", "M"), (23, "Alice", "F"), (23, "Alice", "F"), (14, "Tom", "M")],
["age", "name", "gender"])
df.distinct().show()
# +---+-----+------+
# |age| name|gender|
# +---+-----+------+
# | 14| Tom| M|
# | 23|Alice| F|
# +---+-----+------+