从日期/时间戳或时间间隔中提取部分内容。
有关相应的 Databricks SQL 函数,请参阅 extract 函数。
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.extract(field=<field>, source=<source>)
参数
| 参数 | 类型 | Description |
|---|---|---|
field |
pyspark.sql.Column |
选择应提取的源部分。 |
source |
pyspark.sql.Column 或 str |
从中提取日期 field /时间戳或间隔列。 |
退货
pyspark.sql.Column:日期/时间戳或间隔源的一部分。
例子
import datetime
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([(datetime.datetime(2015, 4, 8, 13, 8, 15),)], ['ts'])
df.select(
'*',
dbf.extract(dbf.lit('YEAR'), 'ts').alias('year'),
dbf.extract(dbf.lit('month'), 'ts').alias('month'),
dbf.extract(dbf.lit('WEEK'), 'ts').alias('week'),
dbf.extract(dbf.lit('D'), df.ts).alias('day'),
dbf.extract(dbf.lit('M'), df.ts).alias('minute'),
dbf.extract(dbf.lit('S'), df.ts).alias('second')
).show()