Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Memisahkan string menjadi array kalimat-kalimat, di mana setiap kalimat adalah array kata-kata.
Argumen language dan country bersifat opsional. Ketika mereka dihilangkan:
- Jika keduanya dihilangkan, digunakan
Locale.ROOT - locale(language='', country='').Locale.ROOTdianggap sebagai lokal dasar semua lokal, dan digunakan sebagai lokal netral bahasa/negara untuk operasi sensitif lokal. - Jika dihilangkan
country, digunakanlocale(language, country='').
Ketika null:
- Jika keduanya
null, keduanyaLocale.US - locale(language='en', country='US')digunakan. -
languageJika null dancountrytidak null,Locale.US - locale(language='en', country='US')digunakan. -
languageJika tidak null dancountrynull, digunakanlocale(language). - Jika tidak ada
null,locale(language, country)digunakan.
Untuk fungsi Databricks SQL yang sesuai, lihat sentences fungsi.
Syntax
from pyspark.databricks.sql import functions as dbf
dbf.sentences(string=<string>, language=<language>, country=<country>)
Parameter-parameternya
| Pengaturan | Tipe | Description |
|---|---|---|
string |
pyspark.sql.Column atau str |
string yang akan dipisahkan |
language |
pyspark.sql.Column atau str, optional |
bahasa lokal |
country |
pyspark.sql.Column atau str, optional |
negara lokal |
Pengembalian Barang
pyspark.sql.Column: array kalimat terpisah.
Examples
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("This is an example sentence.", )], ["s"])
df.select("*", dbf.sentences(df.s, dbf.lit("en"), dbf.lit("US"))).show(truncate=False)
df.select("*", dbf.sentences(df.s, dbf.lit("en"))).show(truncate=False)
df.select("*", dbf.sentences(df.s)).show(truncate=False)