PySpark のリファレンス

このページでは、Spark 用 Python API である PySpark で使用できるリファレンスの概要について説明します。 PySpark の詳細については、 Azure Databricks の PySpark に関するページを参照してください。

データ型

PySpark データ型の完全な一覧については、「 PySpark データ型」を参照してください。

クラス

リファレンス	Description
Avro	Apache Avro 形式でのデータの読み取りと書き込みのサポート。
カタログ	データベース、テーブル、関数、およびその他のカタログメタデータを管理するためのインターフェイス。
コラム	変換や式など、DataFrame 列を操作するための操作。
データ型	PySpark SQL で使用可能なデータ型 (プリミティブ型、複合型、ユーザー定義型など)。
DataFrame	リレーショナルデータベース内のテーブルと同様に、名前付き列に編成されたデータの分散コレクション。
DataFrameNaFunctions	DataFrame で不足しているデータを操作するための機能。
DataFrameReader	外部ストレージシステムから DataFrame を読み込むのに使用されるインターフェイス。
DataFrameStatFunctions	DataFrame を使用した統計関数の機能。
DataFrameWriter	DataFrame を外部ストレージシステムに書き込むのに使用されるインターフェイス。
DataFrameWriterV2	DataFrame を外部ストレージ (バージョン 2) に書き込むのに使用されるインターフェイス。
DataSource	外部システムから読み取るカスタムデータソースを実装するための API。カスタムデータソースの詳細については、「 PySpark カスタムデータソース」を参照してください。
DataSourceArrowWriter	PyArrow の `RecordBatch`を使用してデータを処理するデータソースライターの基本クラス。
DataSourceRegistration	データソース登録のラッパー。
DataSourceReader	データソースリーダーの基本クラス。
DataSourceStreamArrowWriter	PyArrow の `RecordBatch`を使用してデータを処理するデータストリームライターの基本クラス。
DataSourceStreamReader	ストリーミングデータソースリーダーの基本クラス。
DataSourceStreamWriter	データストリームライターの基本クラス。
GroupedData	データをグループ化し、グループ化された DataFrame に対して集計操作を実行するためのメソッド。
観測	メトリックを収集し、監視とデバッグのためにクエリの実行中に DataFrames を監視します。
PlotAccessor	PySpark での DataFrame プロット機能のアクセサー。
ProtoBuf	プロトコルバッファー形式を使用したデータのシリアル化と逆シリアル化のサポート。
行	個々のフィールド値へのアクセスを提供する DataFrame 内のデータ行を表します。
RuntimeConfig	Spark SQL のランタイム構成オプション (実行とオプティマイザーの設定を含む)。 Databricks でのみ使用できる構成の詳細については、「 Azure Databricks での Spark 構成プロパティの設定」を参照してください。
SparkSession	PySpark アプリケーションでデータを読み取り、SQL クエリを実行するためのエントリポイント。
ステートフルプロセッサ	構造化ストリーミングでの複雑なステートフル操作のストリーミングバッチ間の状態を管理します。
UserDefinedFunction (UDF)	カスタム Python ロジックを DataFrame 列に適用するためのユーザー定義関数。
UDFRegistration	ユーザー定義関数登録のラッパー。このインスタンスには、 `spark.udf`でアクセスできます。
UserDefinedTableFunction (UDTF)	入力行ごとに複数の行を返すユーザー定義テーブル関数。
UDTFRegistration	ユーザー定義テーブル関数登録のラッパー。このインスタンスには、 `spark.udtf`でアクセスできます。
VariantVal	動的な型と入れ子構造をサポートする柔軟なスキーマを持つ半構造化データを表します。
ウィンドウ	現在の行に関連する一連のテーブル行にわたって計算を実行するためのウィンドウ関数。
WindowSpec	現在の行に関連する一連のテーブル行にわたって計算を実行するためのウィンドウ関数。

Functions

使用可能な組み込み関数の完全な一覧については、 PySpark 関数を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-03-15

次の方法で共有

PySpark のリファレンス

データ型

クラス

Functions

フィードバック

その他のリソース