次の方法で共有


LZO 圧縮ファイル

ライセンス制限により、Azure Databricks クラスターでは既定で LZO 圧縮コーデックを使用できません。 LZO 圧縮ファイルを読み取るには、起動時に初期化スクリプトを使用して、クラスターにコーデックをインストールする必要があります。

ノートブックの例: Init LZO 圧縮ファイル

次のノートブックとなります。

  • LZO コーデックをビルドします。
  • 次のような init スクリプトを作成します。
    • LZO 圧縮ライブラリと lzop コマンドをインストールし、LZO コーデックを適切なクラス パスにコピーします。
    • LZO 圧縮コーデックを使用するように Spark を構成します。

LZO 圧縮ファイルの初期化ノートブック

ノートブックを入手

ノートブックの例: LZO 圧縮ファイルの読み取り

次のノートブックは、init スクリプトによってインストールされたコーデックを使用して LZO 圧縮ファイルを読み取ります。

LZO 圧縮ファイルの読み取りノートブック

ノートブックを入手