double 값을 반환하고, 일치하는 항목이 없으면 값 0을 반환하고, 일치 항목이 있지만 값이 숫자가 아닌 경우 NaN을 반환합니다.
문법
from pyspark.sql import functions as sf
sf.xpath_number(xml, path)
매개 변수
| 매개 변수 | 유형 | Description |
|---|---|---|
xml |
pyspark.sql.Column 또는 str |
XML 열 또는 열 이름입니다. |
path |
pyspark.sql.Column 또는 str |
XPath 식입니다. |
예시
import pyspark.sql.functions as sf
spark.createDataFrame(
[('<a><b>1</b><b>2</b></a>',)], ['x']
).select(sf.xpath_number('x', sf.lit('sum(a/b)'))).show()
+-------------------------+
|xpath_number(x, sum(a/b))|
+-------------------------+
| 3.0|
+-------------------------+