Anmerkung
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen, dich anzumelden oder die Verzeichnisse zu wechseln.
Der Zugriff auf diese Seite erfordert eine Genehmigung. Du kannst versuchen , die Verzeichnisse zu wechseln.
Gibt die Teilzeichenfolge aus der Zeichenfolge str zurück, die vor dem Auftreten des Trennzeichens delim nach einer bestimmten Anzahl liegt. Wenn die Anzahl positiv ist, wird alles links vom letzten Trennzeichen (von links gezählt) zurückgegeben. Wenn die Anzahl negativ ist, wird rechts neben dem endgültigen Trennzeichen (von rechts gezählt) zurückgegeben. substring_index führt beim Suchen nach "Delim" eine Übereinstimmung zwischen Groß- und Kleinschreibung durch.
Die entsprechende Databricks SQL-Funktion finden Sie unter substring_index Funktion.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.substring_index(str=<str>, delim=<delim>, count=<count>)
Die Parameter
| Parameter | Typ | Description |
|---|---|---|
str |
pyspark.sql.Column oder str |
Zielspalte, an der gearbeitet werden soll. |
delim |
literal string |
Trennzeichen von Werten. |
count |
int |
Anzahl der Vorkommen. |
Rückkehr
pyspark.sql.Column: Teilzeichenfolge des angegebenen Werts.
Examples
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()