Поделиться через


Типы данных PySpark

На этой странице представлен список типов данных PySpark, доступных в Databricks, со ссылками на соответствующую справочную документацию.

Тип данных Description
ArrayType(elementType[, containsNull]) Тип данных массива
BinaryType() Тип данных бинарный (массив байтов)
BooleanType() тип данных Boolean
ByteType() Тип данных Byte, представляющий 8-разрядные целые числа со знаком
CalendarIntervalType() Календарные интервалы
CharType(length) Тип данных Char
DataType() Базовый класс для типов данных
DateType() Тип данных «Date» (datetime.date)
DayTimeIntervalType([startField, endField]) DayTimeIntervalType (datetime.timedelta)
DecimalType([precision, scale]) Десятичная (десятичная. Десятичный) тип данных
DoubleType() Тип данных double, представляющий числа с плавающей запятой двойной точности
FloatType() Тип данных Float, представляющий числа с плавающей запятой одиночной точности
Geography Тип данных География
Geometry Тип данных Геометрия
IntegerType() Тип данных Int, представляющий 32-разрядные целые числа со знаком
LongType() Длинный тип данных, представляющий 64-разрядные целые числа со знаком
MapType(keyType, valueType[, valueContainsNull]) Тип данных карты
NullType() Тип NULL
ShortType() Короткий тип данных, представляющий 16-разрядные целые числа со знаком
StringType([collation]) строковый тип данных
StructField(name, dataType[, nullable, metadata]) Поле в StructType
StructType([fields]) Тип структуры, состоящий из списка StructField
TimestampType() Тип данных Timestamp (datetime.datetime)
TimestampNTZType() Тип данных Timestamp (datetime.datetime) без сведений о часовом поясе
VarcharType(length) Тип данных Varchar
VariantType() Тип данных Variant, представляющий полуструктурированные значения
YearMonthIntervalType([startField, endField]) YearMonthIntervalType представляет интервалы год-месяц в стандарте SQL.