Lakeflow Designer にデータを取り込む

Important

この機能は パブリック プレビュー段階です

このページでは、Lakeflow Designer でビジュアル データ準備にデータを取り込むための使用可能なオプションについて説明します。 デザイナーは、Azure Databricksを介してアクセスできる任意のデータを操作できます。

Designer のすべてのデータ インジェストは 、Source 演算子で始まります。 ソース オペレーターの構成ウィンドウを開くと、次のオプションがあります。

既存のテーブルを参照する

[ 既存のものを参照 ] をクリックしてアセット セレクターを開きます。ここで、次のことができます。

  • Unity カタログでテーブルとボリュームを参照します。
  • ワークスペース ファイル システム内のファイルを参照します。

データが既にAzure Databricksされている場合は、このオプションを使用します。

ローカル ファイルをドラッグ アンド ドロップする

CSV またはExcel ファイルをローカル コンピューターからキャンバスに直接ドラッグします。 デザイナーはファイルをワークスペース ファイル システムにアップロードし、Source 演算子を自動的に作成します。

Excel ファイルをドラッグ アンド ドロップするには、Excelファイル形式のサポートを有効にする必要があります。 「Excel ファイルの読み取り」を参照してください。

ファイルからテーブルを作成する

[ソース構成] ウィンドウで [ファイルからテーブルを作成を選択してローカル CSV またはExcel ファイルをアップロードし、そこから Unity カタログ テーブルを作成します。 このオプションは、データをワークスペース ファイルとして保存するのではなく、マネージド テーブルとして保持する場合に使用します。 さらに、大量のデータの場合は、最適なパフォーマンスが提供されます。

Google ドライブからインポートする

Google ドライブからファイルをインポートするには:

  1. [ソースの構成] ウィンドウで、[ Google ドライブからインポート] を選択します。
  2. Google ドライブにアクセスできる Unity カタログ接続を選択します。
  3. ファイルの URL を指定します。

これには、Google Drive アクセス用に構成された Unity カタログ接続が必要です。 接続を設定する方法については、「 Google ドライブからファイルを取り込 む」を参照してください。

SharePointからのインポート

SharePointからファイルをインポートするには:

  1. [ソース構成] ウィンドウで、[SharePointを選択します。
  2. SharePoint サイトにアクセスできる Unity カタログ接続を選択します。
  3. 直接ファイル リンクを指定します。

Warnung

正しい URL を取得するには、SharePointでファイルを右クリックし、Preview を選択し、ブラウザーのアドレス バーから URL をコピーします。 共有リンクは使用しないでください。

これには、SharePoint アクセス用に構成された Unity カタログ接続が必要です。 接続の設定方法については、「 SharePointを参照してください。

追加のソースに Lakeflow Connect を使用する

デザイナーでデータ ソースを直接使用できない場合は、 Lakeflow Connect でマネージド コネクタを確認します。 Lakeflow Connect では、SaaS アプリケーション (Salesforce、Workday、HubSpot など)、データベース、クラウド ストレージ、ストリーミング ソースからのインジェストがサポートされています。 Lakeflow Connect を使用して Unity カタログ テーブルにデータを取り込んだ後は、デザイナーでソースとして使用できます。

次のステップ