次の方法で共有


to_csv

StructTypeを含む列を CSV 文字列に変換します。 サポートされていない型の場合は、例外をスローします。

構文

from pyspark.sql import functions as sf

sf.to_csv(col, options=None)

パラメーター

パラメーター タイプ Description
col pyspark.sql.Column または str 構造体を含む列の名前。
options dict、省略可能 変換を制御するオプション。 CSV データソースと同じオプションを受け入れます。

返品ポリシー

pyspark.sql.Column: 指定された StructTypeから変換された CSV 文字列。

例示

例 1: 単純な StructType を CSV 文字列に変換する

from pyspark.sql import Row, functions as sf
data = [(1, Row(age=2, name='Alice'))]
df = spark.createDataFrame(data, ("key", "value"))
df.select(sf.to_csv(df.value)).show()
+-------------+
|to_csv(value)|
+-------------+
|      2,Alice|
+-------------+

例 2: 複合構造体型を CSV 文字列に変換する

from pyspark.sql import Row, functions as sf
data = [(1, Row(age=2, name='Alice', scores=[100, 200, 300]))]
df = spark.createDataFrame(data, ("key", "value"))
df.select(sf.to_csv(df.value)).show(truncate=False)
+-------------------------+
|to_csv(value)            |
+-------------------------+
|2,Alice,"[100, 200, 300]"|
+-------------------------+

例 3: NULL 値を持つ StructType を CSV 文字列に変換する

from pyspark.sql import Row, functions as sf
from pyspark.sql.types import StructType, StructField, IntegerType, StringType
data = [(1, Row(age=None, name='Alice'))]
schema = StructType([
  StructField("key", IntegerType(), True),
  StructField("value", StructType([
    StructField("age", IntegerType(), True),
    StructField("name", StringType(), True)
  ]), True)
])
df = spark.createDataFrame(data, schema)
df.select(sf.to_csv(df.value)).show()
+-------------+
|to_csv(value)|
+-------------+
|       ,Alice|
+-------------+

例 4: 異なるデータ型を持つ StructType を CSV 文字列に変換する

from pyspark.sql import Row, functions as sf
data = [(1, Row(age=2, name='Alice', isStudent=True))]
df = spark.createDataFrame(data, ("key", "value"))
df.select(sf.to_csv(df.value)).show()
+-------------+
|to_csv(value)|
+-------------+
| 2,Alice,true|
+-------------+