Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Een kolom in een DataFrame.
Ondersteunt Spark Connect
Syntaxis
Methods
| Methode | Beschrijving |
|---|---|
alias(*alias, **kwargs) |
Retourneert deze kolom met een alias met een nieuwe naam of namen (in het geval van expressies die meer dan één kolom retourneren, zoals exploderen). |
asc() |
Retourneert een sorteerexpressie op basis van de oplopende volgorde van de kolom. |
asc_nulls_first() |
Retourneert een sorteerexpressie op basis van oplopende volgorde van de kolom en null-waarden retourneren vóór niet-null-waarden. |
asc_nulls_last() |
Retourneert een sorteerexpressie op basis van oplopende volgorde van de kolom en null-waarden worden weergegeven na niet-null-waarden. |
astype(dataType) |
Alias voor cast(). |
between(lowerBound, upperBound) |
Controleer of de waarden van de huidige kolom tussen de opgegeven onder- en bovengrenzen liggen, inclusief. |
bitwiseAND(other) |
Bereken bitsgewijze EN van deze expressie met een andere expressie. |
bitwiseOR(other) |
Bereken bitsgewijze OF van deze expressie met een andere expressie. |
bitwiseXOR(other) |
Bereken bitwise XOR van deze expressie met een andere expressie. |
cast(dataType) |
Hiermee wordt de kolom omgezet in het type dataType. |
contains(other) |
Bevat het andere element. |
desc() |
Retourneert een sorteerexpressie op basis van de aflopende volgorde van de kolom. |
desc_nulls_first() |
Retourneert een sorteerexpressie op basis van de aflopende volgorde van de kolom en null-waarden worden weergegeven vóór niet-null-waarden. |
desc_nulls_last() |
Retourneert een sorteerexpressie op basis van de aflopende volgorde van de kolom en null-waarden worden weergegeven na niet-null-waarden. |
dropFields(*fieldNames) |
Een expressie waarmee velden in StructType op naam worden neergeslagen. |
endswith(other) |
Tekenreeks eindigt met. |
eqNullSafe(other) |
Gelijkheidstest die veilig is voor null-waarden. |
getField(name) |
Een expressie die een veld op naam ophaalt in een StructType. |
getItem(key) |
Een expressie die een item op positie ordinaal uit een lijst haalt of een item ophaalt met een toets uit een dict. |
ilike(other) |
SQL ILIKE-expressie (niet hoofdlettergevoelig LIKE). |
isNaN() |
Waar als de huidige expressie NaN is. |
isNotNull() |
Waar als de huidige expressie NIET null is. |
isNull() |
Waar als de huidige expressie null is. |
isin(*cols) |
Een Booleaanse expressie die wordt geëvalueerd als waar als de waarde van deze expressie is opgenomen in de geëvalueerde waarden van de argumenten. |
like(other) |
SQL-achtige expressie. |
name(*alias, **kwargs) |
Alias voor alias(). |
otherwise(value) |
Evalueert een lijst met voorwaarden en retourneert een van meerdere mogelijke resultaatexpressies. |
over(window) |
Definieer een vensterkolom. |
rlike(other) |
SQL RLIKE-expressie (LIKE met Regex). |
startswith(other) |
Tekenreeks begint met. |
substr(startPos, length) |
Retourneert een kolom die een subtekenreeks van de kolom is. |
try_cast(dataType) |
Dit is een speciale versie van cast die dezelfde bewerking uitvoert, maar retourneert een NULL-waarde in plaats van een fout op te geven als de aanroepmethode een uitzondering genereert. |
when(condition, value) |
Evalueert een lijst met voorwaarden en retourneert een van meerdere mogelijke resultaatexpressies. |
withField(fieldName, col) |
Een expressie waarmee een veld in StructType op naam wordt toegevoegd/vervangen. |
Bedieners
De kolomklasse ondersteunt standaard Python-operators voor rekenkundige, vergelijkings- en logische bewerkingen:
-
Rekenkundig:
+,-,*, ,/, ,%** -
Vergelijking:
==,!=,<, ,<=,>>= -
Logisch:
&(EN),|(OF),~(NIET)
Examples
Zie Kolombewerkingen voor eenvoudige voorbeelden die het gebruik van kolommen demonstreren.
Kolomexemplaren maken
Selecteer een kolom in een DataFrame:
df = spark.createDataFrame(
[(2, "Alice"), (5, "Bob")], ["age", "name"])
# Access by attribute
df.name
# Column<'name'>
# Access by bracket notation
df["name"]
# Column<'name'>
Een kolom maken op basis van een expressie:
df.age + 1
# Column<...>
1 / df.age
# Column<...>
Basiskolombewerkingen
# Arithmetic operations
df.select(df.age + 10).show()
# Comparison operations
df.filter(df.age > 3).show()
# String operations
df.filter(df.name.startswith("A")).show()
# Null checking
df.filter(df.name.isNotNull()).show()
Voorwaardelijke logica
from pyspark.sql import functions as F
df.select(
F.when(df.age < 3, "child")
.when(df.age < 13, "kid")
.otherwise("adult")
.alias("age_group")
).show()
Sorteervolgorde
df.orderBy(df.age.desc()).show()
df.orderBy(df.age.asc_nulls_last()).show()