na

Vrátí nový datový rámec, ve kterém je každý řádek odsouhlasený tak, aby odpovídal zadanému schématu.

Syntaxe

to(schema: StructType)

Parametry

Parameter Typ Description
schema Typ struktury Zadané schéma.

Návraty

DataFrame: Odsouhlasené datové rámce.

Poznámky

  • Podle názvu můžete změnit pořadí sloupců nebo vnitřních polí tak, aby odpovídaly zadanému schématu.
  • Project sloupce nebo vnitřní pole, která nejsou potřebná zadaným schématem. Chybějící sloupce nebo vnitřní pole (přítomná v zadaném schématu, ale ne vstupní datový rámec) vedou k chybám.
  • Přetypujte sloupce nebo vnitřní pole tak, aby odpovídaly datovým typům v zadaném schématu, pokud jsou typy kompatibilní, například číselné na číselné (chyba v případě přetečení), ale nikoli řetězec na int.
  • Přeneste metadata ze zadaného schématu, zatímco sloupce a/nebo vnitřní pole stále obsahují vlastní metadata, pokud nejsou přepsána zadaným schématem.
  • Selhání, pokud není kompatibilní s nulovou hodnotou. Například sloupec nebo vnitřní pole má hodnotu null, ale zadané schéma vyžaduje, aby neměly hodnotu null.

Podporuje Spark Connect.

Příklady

from pyspark.sql.types import StructField, StringType
df = spark.createDataFrame([("a", 1)], ["i", "j"])
df.schema
# StructType([StructField('i', StringType(), True), StructField('j', LongType(), True)])

schema = StructType([StructField("j", StringType()), StructField("i", StringType())])
df2 = df.to(schema)
df2.schema
# StructType([StructField('j', StringType(), True), StructField('i', StringType(), True)])
df2.show()
# +---+---+
# |  j|  i|
# +---+---+
# |  1|  a|
# +---+---+