Udostępnij przez


months_between

Zwraca liczbę miesięcy między datami date1 i date2. Jeśli data1 jest późniejsza niż data2, wynik jest dodatni. Liczba całkowita jest zwracana, jeśli oba dane wejściowe mają ten sam dzień miesiąca lub oba te dane są ostatnim dniem odpowiednich miesięcy. W przeciwnym razie jest obliczana różnica przy założeniu 31 dni na miesiąc. Wynik jest zaokrąglany do 8 cyfr, chyba że roundOff ustawiono wartość False.

Aby uzyskać odpowiednią funkcję SQL usługi Databricks, zobacz months_between funkcja.

Składnia

from pyspark.databricks.sql import functions as dbf

dbf.months_between(date1=<date1>, date2=<date2>, roundOff=<roundOff>)

Parametry

Parameter Typ Description
date1 pyspark.sql.Column lub str pierwsza kolumna daty.
date2 pyspark.sql.Column lub str druga kolumna daty.
roundOff bool, optional czy zaokrąglić (do 8 cyfr) wartość końcową, czy nie (wartość domyślna: True).

Zwraca

pyspark.sql.Column: liczba miesięcy między dwiema datami.

Przykłady

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('1997-02-28 10:30:00', '1996-10-30')], ['d1', 'd2'])
df.select('*', dbf.months_between(df.d1, df.d2)).show()
df.select('*', dbf.months_between('d2', 'd1')).show()
df.select('*', dbf.months_between('d1', df.d2, False)).show()