toArrow

Vrátí obsah tohoto datového rámce jako PyArrow pyarrow.Table.

Přidáno do Databricks Runtime 15.3

Syntaxe

toArrow()

Návraty

pyarrow.Table

Poznámky

Tato metoda by se měla použít pouze v případě, že výsledná hodnota PyArrow pyarrow.Table bude malá, protože všechna data se načtou do paměti ovladače.

Tato možnost je dostupná jenom v případě, že je PyArrow nainstalovaný a dostupný.

Toto rozhraní API je vývojářské rozhraní API.

Příklady

df = spark.createDataFrame([(2, "Alice"), (5, "Bob")], schema=["age", "name"])
df.coalesce(1).toArrow()
# pyarrow.Table
# age: int64
# name: string
# ----
# age: [[2,5]]
# name: [["Alice","Bob"]]