Teilen über


substring_index

Gibt die Teilzeichenfolge aus der Zeichenfolge str zurück, die vor dem Auftreten des Trennzeichens delim nach einer bestimmten Anzahl liegt. Wenn die Anzahl positiv ist, wird alles links vom letzten Trennzeichen (von links gezählt) zurückgegeben. Wenn die Anzahl negativ ist, wird rechts neben dem endgültigen Trennzeichen (von rechts gezählt) zurückgegeben. substring_index führt beim Suchen nach "Delim" eine Übereinstimmung zwischen Groß- und Kleinschreibung durch.

Die entsprechende Databricks SQL-Funktion finden Sie unter substring_index Funktion.

Syntax

from pyspark.databricks.sql import functions as dbf

dbf.substring_index(str=<str>, delim=<delim>, count=<count>)

Die Parameter

Parameter Typ Description
str pyspark.sql.Column oder str Zielspalte, an der gearbeitet werden soll.
delim literal string Trennzeichen von Werten.
count int Anzahl der Vorkommen.

Rückkehr

pyspark.sql.Column: Teilzeichenfolge des angegebenen Werts.

Examples

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([('a.b.c.d',)], ['s'])
df.select('*', dbf.substring_index(df.s, '.', 2)).show()
df.select('*', dbf.substring_index('s', '.', -3)).show()