Notebook アクティビティを使用して、Data Factory パイプラインの一部として Microsoft Fabric で作成した ノートブック を実行します。 ノートブック を使用すると、Apache Spark ジョブを実行して、データ ワークフローの一部としてデータを取り込んだり、クリーンアップしたり、変換したりできます。 Fabric のパイプラインに Notebook アクティビティを簡単に追加できます。このガイドでは、各手順について説明します。
前提条件
開始するには、次の前提条件を満たしている必要があります。
- アクティブなサブスクリプションが含まれるテナント アカウント。 無料でアカウントを作成できます。
- ワークスペースが作成されている。
- ワークスペースにノートブックが作成されている。 新しいノートブックを作成するには、Microsoft Fabric ノートブックを作成する方法に関する記事を参照してください。
ノートブック アクティビティを作成する
ワークスペースに新しいパイプラインを作成します。
パイプラインの [アクティビティ] ペイン内でノートブックを検索し、それを選択してパイプライン キャンバスに追加します。
まだ選択されていない場合は、キャンバスで新しいノートブック アクティビティを選択します。
[全般設定] タブを構成するには、全般設定のガイダンスを参照してください。
ノートブックの設定を構成する
[Settings](設定) タブを選択します。
[ 接続] で、ノートブックの実行の認証方法を選択し、選択内容に基づいて必要な資格情報または ID 構成を指定します。
- サービス プリンシパル (SPN) – ユーザー資格情報に依存せずに安全で自動化された実行を保証する運用シナリオに推奨されます。
- ワークスペース ID (WI) – 一元化された ID ガバナンスが必要なマネージド環境に最適です。
[ノートブック] ドロップダウンから既存のノートブックを選択し、必要に応じてノートブックに渡すパラメーターを指定します。
ノートブック アクティビティでのファブリック ワークスペース ID (WI) の使用
ワークスペース ID を作成する ワークスペースで WI を有効にする必要があります (読み込みに少し時間がかかる場合があります)。 Fabric ワークスペースにワークスペース ID を作成します。 ワークスペース ID に関するドキュメントを確認してください。
テナント レベルの設定を有効にする Fabric 管理ポータルで、次のテナント設定を有効にします。サービス プリンシパルは、Fabric パブリック API を呼び出すことができます。 この設定は、ワークスペース ID が正常に認証されるために必要です。 管理者 API のサービス プリンシパル認証を有効にする方法に関するドキュメントを参照してください。
ワークスペース ID にワークスペースのアクセス許可を付与する ワークスペースを開き、[アクセスの管理] を選択し、ワークスペース ID にアクセス許可を割り当てます。 ほとんどのシナリオでは、共同作成者アクセスで十分です。 ワークスペースへのアクセス権をユーザーに付与する方法に関するドキュメントを参照してください。
セッション タグを設定する
ノートブック ジョブの実行にかかる時間を最小限に抑えるために、必要に応じてセッション タグを設定できます。 セッション タグを設定すると、既存の Spark セッションを再利用するように Spark に指示され、起動時間が最小限に抑えられます。 セッション タグには任意の文字列値を使用できます。 セッションが存在しない場合は、タグ値を使用して新しいセッションが作成されます。
注
セッション タグを使用できるようにするには、複数のノートブックを実行するパイプライン用の高コンカレンシー モード オプションをオンにする必要があります。 このオプションは、[ワークスペース設定] の下にある [Spark 設定] の [高コンカレンシー モード] で確認できます
パイプラインを保存して実行またはスケジュールする
パイプライン エディターの上部にある [ホーム] タブに切り替え、[保存] ボタンを選択してパイプラインを保存します。 [実行] を選択して直接実行するか、[スケジュール] を選択してスケジュールを設定します。 ここで実行履歴を表示したり、他の設定を構成したりすることもできます。