에게

각 행이 지정된 스키마와 일치하도록 조정되는 새 DataFrame을 반환합니다.

문법

to(schema: StructType)

매개 변수

매개 변수 유형 설명
schema 구조형 타입 지정된 스키마입니다.

Returns

DataFrame: 조정된 데이터 프레임입니다.

Notes

  • 지정된 스키마와 일치하도록 이름별로 열 및/또는 내부 필드의 순서를 다시 지정합니다.
  • 지정된 스키마에 필요하지 않은 열 및/또는 내부 필드를 Project. 열 및/또는 내부 필드가 누락되어(지정된 스키마에 있지만 입력 DataFrame에 없음) 오류가 발생합니다.
  • 형식이 호환되는 경우 열 및/또는 내부 필드를 지정된 스키마의 데이터 형식과 일치하도록 캐스팅합니다(예: 숫자에서 숫자로(오버플로의 경우 오류) int할 문자열은 아닙니다.
  • 지정된 스키마에서 메타데이터를 이월하는 반면 열 및/또는 내부 필드는 지정된 스키마로 덮어쓰지 않은 경우에도 자체 메타데이터를 유지합니다.
  • Null 허용 여부가 호환되지 않으면 실패합니다. 예를 들어 열 및/또는 내부 필드는 null을 허용하지만 지정된 스키마는 null을 허용하지 않아도 됩니다.

Spark Connect를 지원합니다.

예제

from pyspark.sql.types import StructField, StringType
df = spark.createDataFrame([("a", 1)], ["i", "j"])
df.schema
# StructType([StructField('i', StringType(), True), StructField('j', LongType(), True)])

schema = StructType([StructField("j", StringType()), StructField("i", StringType())])
df2 = df.to(schema)
df2.schema
# StructType([StructField('j', StringType(), True), StructField('i', StringType(), True)])
df2.show()
# +---+---+
# |  j|  i|
# +---+---+
# |  1|  a|
# +---+---+