Partager via


window_time

Calcule l’heure de l’événement à partir d’une colonne de fenêtre. Les valeurs de la fenêtre de colonne sont produites par les opérateurs d’agrégation de fenêtres et sont de type STRUCT<start: TIMESTAMP, end: TIMESTAMP> où le début est inclusif et la fin est exclusive. Le temps d’événement des enregistrements générés par les opérateurs d’agrégation de fenêtre peut être calculé comme window_time(window) et le sont window.end - lit(1).alias("microsecond") (comme microseconde correspond à la précision minimale prise en charge de l’heure d’événement). La colonne de fenêtre doit être une colonne produite par un opérateur d’agrégation de fenêtre.

Pour obtenir plus de détails sur la fonction SQL de Databricks correspondante, consultez window_time.

Syntaxe

from pyspark.databricks.sql import functions as dbf

dbf.window_time(windowColumn=<windowColumn>)

Paramètres

Paramètre Type Descriptif
windowColumn pyspark.sql.Column ou str Colonne de fenêtre d’un enregistrement d’agrégation de fenêtre.

Retours

pyspark.sql.Column: colonne pour les résultats calculés.

Examples

import datetime
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(datetime.datetime(2016, 3, 11, 9, 0, 7), 1)], ['dt', 'v'])
df2 = df.groupBy(dbf.window('dt', '5 seconds')).agg(dbf.sum('v'))