Q: 専用 SQL プール、サーバーレス SQL プール、サーバーレス Spark プールを管理するにはどうすればよいですか?

Azure Synapse では、出発点として、Azure サブスクリプション レベルで利用可能な組み込みのコスト分析とコスト アラートを使用します。 専用 SQL プール - お客様が専用 SQL プールを作成し、そのサイズを指定するので、コストを直接可視化して管理できます。 Azure RBAC ロールを使用することで、専用 SQL プールを作成またはスケーリングできるユーザーをさらに制御できます。 サーバーレス SQL プール - 監視とコスト管理の制御により、毎日、毎週、および毎月のレベルで支出の上限を設定できます。 詳細については、 サーバーレス SQL プールのコスト管理 に関するページを参照してください。 サーバーレス Spark プール - Synapse RBAC ロールを使用して Spark プールを作成できるユーザーを制限できます。

Q: Azure Synapse ワークスペースでは CI/CD がサポートされていますか。

はい、ご利用いただけます。 すべてのパイプライン成果物、ノートブック、SQL スクリプト、および Spark ジョブ定義が、Git に存在します。 プール定義はすべて、Git に Azure Resource Manager (ARM) テンプレートとして格納されます。 専用 SQL プールのオブジェクト (スキーマ、テーブル、ビューなど) は、CI/CD がサポートされたデータベース プロジェクトで管理されます。 詳細については、こちらの CI および CD に関するガイド を参照してください。

Q: 専用 SQL プールとサーバーレス プールの機能にはどのような違いがありますか。

2 種類のプール間では、機能と要件に違いがあります。 相違点として、データベース オブジェクト、クエリ言語機能、セキュリティ、ツール、データ アクセス、データ形式などが挙げられます。 SQL プールとサーバーレス プールの詳細な比較については、 プールの比較 に関するページを参照してください。 いずれかの種類のプールを使用する場合のベスト プラクティスについては、 専用 SQL プールのベスト プラクティス および サーバーレス SQL プールのベスト プラクティス に関するページを参照してください。

Q: Delta テーブルとは何ですか。なぜ使用する必要があるのでしょうか。

Lakehouse は、Apache Parquet などのオープンな直接アクセス データ形式に基づいています。 機械学習とデータ サイエンスを最高レベルでサポートしています。 Delta テーブルは、Delta Lake に含まれるデータのビューであり、Apache Spark DataFrame の読み取りおよび書き込み API によって提供されるほとんどのオプションをサポートしています。 Lakehouses は、データの古さ、信頼性、総保有コスト、データ ロックインなど、データ ウェアハウスに関する大きな課題の解決に役立ちます。 Delta テーブルでは、自動圧縮やアダプティブ クエリ プランなどの最適化を使用できます。 Delta Lake の詳細なガイドについては、 Delta Lake に関するガイド を参照してください。

Q: 自動圧縮とは何ですか。

自動圧縮は、Delta テーブルの 自動最適化に関する 2 つの補完的機能のうちの 1 つです。 テーブルへの書き込みが成功した後、自動圧縮により、小さなファイルの数が最も多いパーティションのファイルをさらに圧縮できます。 分単位の待機時間の追加が許容されるストリーミングのユース ケースや、テーブルに対して定期的な OPTIMIZE 呼び出しがない場合には、自動圧縮をオプトインすることをお勧めします。 自動最適化と自動圧縮の詳細については、こちらの 自動最適化に関するガイド を参照してください。

Question 1

RBAC ロールを使用してワークスペースをセキュリティで保護するにはどうすればよいですか。

Accepted Answer

Azure Synapse では、複数のロールとスコープが導入されています。これらを割り当てることで、ワークスペースを容易にセキュリティで保護できます。

Synapse RBAC ロール:

Synapse 管理者
Synapse SQL 管理者
Apache Spark 管理者
Synapse 共同作成者
Synapse 成果物発行元
Synapse 成果物ユーザー
Synapse コンピューティングオペレーター
Synapse 資格情報ユーザー
Synapse のリンクされた Data Manager
Synapse ユーザー

Synapse ワークスペースをセキュリティで保護するには、RBAC ロールを次の RBAC スコープに割り当てます。

Workspaces
Spark プール
統合ランタイム
リンクされたサービス
資格情報

さらに、専用 SQL プールでは、使い慣れたすべてのセキュリティ機能を使用できます。

Question 2

専用 SQL プール、サーバーレス SQL プール、サーバーレス Spark プールを管理するにはどうすればよいですか?

Accepted Answer

Azure Synapse では、出発点として、Azure サブスクリプションレベルで利用可能な組み込みのコスト分析とコストアラートを使用します。

専用 SQL プール - お客様が専用 SQL プールを作成し、そのサイズを指定するので、コストを直接可視化して管理できます。 Azure RBAC ロールを使用することで、専用 SQL プールを作成またはスケーリングできるユーザーをさらに制御できます。
サーバーレス SQL プール - 監視とコスト管理の制御により、毎日、毎週、および毎月のレベルで支出の上限を設定できます。詳細については、サーバーレス SQL プールのコスト管理に関するページを参照してください。
サーバーレス Spark プール - Synapse RBAC ロールを使用して Spark プールを作成できるユーザーを制限できます。

Question 3

一般提供の Synapse ワークスペースでは、オブジェクトのフォルダー編成と粒度がサポートされていますか。

Accepted Answer

Synapse ワークスペースでは、ユーザー定義のフォルダーがサポートされています。

Question 4

複数の Power BI ワークスペースを 1 つの Azure Synapse ワークスペースにリンクすることはできますか。

Accepted Answer

はい。2021 年 6 月 10 日の時点で、Synapse Studio では、1 つの Azure Synapse ワークスペースに複数の Power BI ワークスペースを追加できるようになりました。

Question 5

Azure Cosmos DB への Azure Synapse Link は一般提供されていますか?

Accepted Answer

Important

Synapse Link for Cosmos DB は、新しいプロジェクトではサポートされなくなりました。この機能は使用しないでください。

現在 GA になっている Microsoft Fabric 用の Azure Cosmos DB ミラーリングを使用してください。ミラーリングは、同じゼロ ETL の利点を提供し、Microsoft Fabric と完全に統合されています。詳細については、 Cosmos DB ミラーリングの概要に関するページを参照してください。

Question 6

Azure Synapse Link for SQL は一般提供されていますか?

Accepted Answer

Azure Synapse Link for SQL は、SQL Server 2022 と Azure SQL Database の両方で一般提供されています。詳細については、SQL 用 Azure Synapse Link の概要に関する記事を参照してください。

Question 7

Azure Synapse ワークスペースでは CI/CD がサポートされていますか。

Accepted Answer

はい、ご利用いただけます。すべてのパイプライン成果物、ノートブック、SQL スクリプト、および Spark ジョブ定義が、Git に存在します。プール定義はすべて、Git に Azure Resource Manager (ARM) テンプレートとして格納されます。専用 SQL プールのオブジェクト (スキーマ、テーブル、ビューなど) は、CI/CD がサポートされたデータベースプロジェクトで管理されます。詳細については、こちらの CI および CD に関するガイドを参照してください。

Question 8

専用 SQL プールとサーバーレス プールの機能にはどのような違いがありますか。

Accepted Answer

2 種類のプール間では、機能と要件に違いがあります。相違点として、データベースオブジェクト、クエリ言語機能、セキュリティ、ツール、データアクセス、データ形式などが挙げられます。 SQL プールとサーバーレスプールの詳細な比較については、プールの比較に関するページを参照してください。いずれかの種類のプールを使用する場合のベストプラクティスについては、専用 SQL プールのベストプラクティスおよびサーバーレス SQL プールのベストプラクティスに関するページを参照してください。

Question 9

Delta テーブルとは何ですか。なぜ使用する必要があるのでしょうか。

Accepted Answer

Lakehouse は、Apache Parquet などのオープンな直接アクセスデータ形式に基づいています。機械学習とデータサイエンスを最高レベルでサポートしています。 Delta テーブルは、Delta Lake に含まれるデータのビューであり、Apache Spark DataFrame の読み取りおよび書き込み API によって提供されるほとんどのオプションをサポートしています。 Lakehouses は、データの古さ、信頼性、総保有コスト、データロックインなど、データウェアハウスに関する大きな課題の解決に役立ちます。 Delta テーブルでは、自動圧縮やアダプティブクエリプランなどの最適化を使用できます。 Delta Lake の詳細なガイドについては、Delta Lake に関するガイドを参照してください。

Question 10

自動圧縮とは何ですか。

Accepted Answer

自動圧縮は、Delta テーブルの自動最適化に関する 2 つの補完的機能のうちの 1 つです。テーブルへの書き込みが成功した後、自動圧縮により、小さなファイルの数が最も多いパーティションのファイルをさらに圧縮できます。分単位の待機時間の追加が許容されるストリーミングのユースケースや、テーブルに対して定期的な OPTIMIZE 呼び出しがない場合には、自動圧縮をオプトインすることをお勧めします。自動最適化と自動圧縮の詳細については、こちらの自動最適化に関するガイドを参照してください。

Question 11

パイプラインの実行に使用されている資格情報を確認するにはどうすればよいですか。

Accepted Answer

Synapse パイプラインでの各アクティビティは、リンクされたサービス内で指定された資格情報を使用して実行されます。

Question 12

SSIS IR は Synapse 統合でサポートされていますか。

Accepted Answer

現時点ではありません。

Question 13

Azure Data Factory パイプラインと Azure Synapse パイプラインにはどのような違いがありますか。

Accepted Answer

相違点の例としては、グローバルパラメーターのサポート、Data Flow について Spark ジョブの監視、Integration Runtime の共有などがあります。詳細については、データ統合 - Synapse と ADF に関するドキュメントを参照してください。

Question 14

既存のパイプラインを Azure Data Factory から Azure Synapse ワークスペースに移行するにはどうすればよいですか。

Accepted Answer

現時点では、元のパイプラインから JSON をエクスポートし、それを Synapse ワークスペースにインポートして、Azure Data Factory のパイプラインおよび関連する成果物を手動で再作成する必要があります。

Question 15

Apache Spark ジョブ定義を使用するにはどうすればよいですか。

Accepted Answer

こちらのクイックスタートガイドをご覧ください。

Question 16

ADF パイプラインからノートブックを呼び出せますか。

Accepted Answer

このユースケースには 2 つのオプションがあります。 1 つ目のオプションは、パイプラインを ADF のままにすることです。Web アクティビティをラップする必要があります。このオプションの詳細については、こちらの Web アクティビティに関するガイドを参照してください。もう 1 つのオプションは、パイプラインを Synapse に移行することです。 2 つ目のオプションの詳細については、こちらの移行コードのサンプルに関するページを参照してください。

Question 17

Synapse 用 Apache Spark と Apache Spark の違いは何ですか。

Accepted Answer

Synapse 用 Apache Spark は、Apache Spark に、他のサービス (Microsoft Entra ID、Azure ML など) との統合サポート、追加のライブラリ (mssparkutils、Hummingbird)、および事前調整されたパフォーマンス構成が追加されたものです。

現在 Apache Spark 上で実行されているワークロードはすべて、変更することなく Azure Synapse Apache Spark 上で実行できます。

Question 18

Spark のどのバージョンを使用できますか。

Accepted Answer

2023 年 9 月より、Azure Synapse Apache Spark では、Spark 3.3 が完全にサポートされています。コアコンポーネントと現在サポートされているバージョンの完全な一覧については、Apache Spark でサポートされるバージョンに関するページを参照してください。

Question 19

Azure Synapse Spark には、DButils に相当するものがありますか。

Accepted Answer

はい、Azure Synapse Apache Spark には mssparkutils ライブラリが用意されています。このユーティリティに関する詳しいドキュメントについては、「Microsoft Spark Utilities の概要」を参照してください。

Question 20

Apache Spark でセッション パラメーターを設定するにはどうすればよいですか。

Accepted Answer

セッションパラメーターを設定するには、%%configure マジックを使用します。パラメーターを有効にするには、セッションの再起動が必要です。

Question 21

サーバーレス Spark プールでクラスター レベルのパラメーターを設定するにはどうすればよいですか。

Accepted Answer

クラスターレベルのパラメーターを設定するには、Spark プールに spark.conf ファイルを指定します。これにより、そのプールは、構成ファイルに渡されたパラメーターに従います。

Question 22

Azure Synapse Analytics でマルチユーザー Spark クラスターを実行することは可能ですか。

Accepted Answer

Azure Synapse には、特定のユースケースに対応した専用のエンジンが用意されています。 Synapse 用 Apache Spark は、クラスターモデルではなく、ジョブサービスとして設計されています。ユーザーがマルチユーザークラスターモデルに対して求めるシナリオは 2 つあります。

シナリオ 1: 多くのユーザーが、BI のためのデータを提供する 1 つのクラスターにアクセスする。

このタスクを実行する最も簡単な方法は、Spark を使用してデータを作成し、Synapse SQL のサーバー機能を利用してそれらのデータセットに Power BI を接続できるようにします。

シナリオ 2:1 つのクラスターに複数の開発者を配置して、コストを節約する。

このシナリオを満たすには、少数の Spark リソースを使用するように設定されたサーバーレス Spark プールを各開発者に提供する必要があります。サーバーレス Spark プールはコストがかからないため、積極的に使用しない限り、複数の開発者がいる場合のコストを最小限に抑えることができます。容易に相互連携できるように、プールではメタデータ (Spark テーブル) を共有します。

Question 23

ライブラリを追加、管理、インストールする方法を教えてください。

Accepted Answer

外部パッケージは、Spark プールの作成時に requirements.txt ファイルを介してインストールできるほか、Synapse ワークスペースまたは Azure portal からインストールできます。「Azure Synapse Analytics で Apache Spark 用のライブラリを管理する」を参照してください。

Question 24

Synapse Spark ではどのようなツールを利用できますか。

Accepted Answer

Synapse Spark の MSSparkUtils には、エクスペリエンスを向上させ、他のツールやサービスとの統合を容易にするさまざまなユーティリティが用意されています。最小限の手動手順で、ファイルシステムを操作し、環境変数を取得し、ノートブックをまとめてチェーン化し、シークレットを操作できます。完全なドキュメントについては、Microsoft Spark Utilities に関するページを参照してください。

Question 25

専用 SQL プール (旧称 SQL DW) と Azure Synapse ワークスペースの専用 SQL プールの違いは何ですか。

Accepted Answer

Question 26

専用 SQL プールとサーバーレス プールの機能にはどのような違いがありますか。

Accepted Answer

違いの完全な一覧については、Synapse SQL での T-SQL 機能の違いに関するページをご確認ください。

Question 27

Azure Synapse の一般提供が開始されましたが、これまでスタンドアロンであった専用 SQL プールを Azure Synapse に移動するにはどうすればよいですか。

Accepted Answer

“移動” や “移行” は不要です。既存のプールで新しいワークスペース機能を有効にすることができます。そうした場合、破壊的変更は発生せず、Synapse Studio、Spark、サーバーレス SQL プールなどの新機能を使用できるようになります。 Azure Synapse ワークスペース内の専用 SQL プールのすべての機能が専用の SQL プール (以前の SQL DW) に適用されるわけではなく、その逆も同様です。既存の専用 SQL プール (以前の SQL DW) のワークスペース機能を有効にするには、専用の SQL プール (以前の SQL DW) 用のワークスペースを有効にする方法に関するページを参照してください。

Question 28

現在、専用 SQL プールの既定のデプロイはどのようになりますか。

Accepted Answer

既定では、すべての新しい専用 SQL プールがワークスペースにデプロイされます。ただし、必要に応じて、スタンドアロンのフォームファクターで専用 SQL プール (以前の SQL DW) を作成することもできます。

Question 29

Azure Synapse ワークスペースへのアクセスをセキュリティで保護するにはどうすればよいですか。

Accepted Answer

マネージド仮想ネットワークを使用しても、使用しなくても、公衆ネットワークからワークスペースに接続できます。詳細については、接続設定に関するページを参照してください。公衆ネットワークからのアクセスは、公衆ネットワークアクセス機能またはワークスペースファイアウォールを有効にすることで制御できます。または、マネージドプライベートエンドポイントおよび Private Link を使用してワークスペースに接続できます。 Azure Synapse Analytics のマネージド仮想ネットワークを使用しない Synapse ワークスペースは、マネージドプライベートエンドポイントを介して接続することはできません。

次の方法で共有

全般

RBAC ロールを使用してワークスペースをセキュリティで保護するにはどうすればよいですか。

専用 SQL プール、サーバーレス SQL プール、サーバーレス Spark プールを管理するにはどうすればよいですか?

一般提供の Synapse ワークスペースでは、オブジェクトのフォルダー編成と粒度がサポートされていますか。

複数の Power BI ワークスペースを 1 つの Azure Synapse ワークスペースにリンクすることはできますか。

Azure Cosmos DB への Azure Synapse Link は一般提供されていますか?

Azure Synapse Link for SQL は一般提供されていますか?

Azure Synapse ワークスペースでは CI/CD がサポートされていますか。

専用 SQL プールとサーバーレスプールの機能にはどのような違いがありますか。

Delta テーブルとは何ですか。なぜ使用する必要があるのでしょうか。

自動圧縮とは何ですか。

Pipelines

パイプラインの実行に使用されている資格情報を確認するにはどうすればよいですか。

SSIS IR は Synapse 統合でサポートされていますか。

Azure Data Factory パイプラインと Azure Synapse パイプラインにはどのような違いがありますか。

既存のパイプラインを Azure Data Factory から Azure Synapse ワークスペースに移行するにはどうすればよいですか。

Apache Spark ジョブ定義を使用するにはどうすればよいですか。

ADF パイプラインからノートブックを呼び出せますか。

Apache Spark

Synapse 用 Apache Spark と Apache Spark の違いは何ですか。

Spark のどのバージョンを使用できますか。

Azure Synapse Spark には、DButils に相当するものがありますか。

Apache Spark でセッションパラメーターを設定するにはどうすればよいですか。

サーバーレス Spark プールでクラスターレベルのパラメーターを設定するにはどうすればよいですか。

Azure Synapse Analytics でマルチユーザー Spark クラスターを実行することは可能ですか。

ライブラリを追加、管理、インストールする方法を教えてください。

Synapse Spark ではどのようなツールを利用できますか。

専用 SQL プール

専用 SQL プール (旧称 SQL DW) と Azure Synapse ワークスペースの専用 SQL プールの違いは何ですか。

専用 SQL プールとサーバーレスプールの機能にはどのような違いがありますか。

Azure Synapse の一般提供が開始されましたが、これまでスタンドアロンであった専用 SQL プールを Azure Synapse に移動するにはどうすればよいですか。

現在、専用 SQL プールの既定のデプロイはどのようになりますか。

ネットワークのセキュリティ

Azure Synapse ワークスペースへのアクセスをセキュリティで保護するにはどうすればよいですか。

次のステップ

次の方法で共有

Azure Synapse Analytics についてよく寄せられる質問

全般

RBAC ロールを使用してワークスペースをセキュリティで保護するにはどうすればよいですか。

専用 SQL プール、サーバーレス SQL プール、サーバーレス Spark プールを管理するにはどうすればよいですか?

一般提供の Synapse ワークスペースでは、オブジェクトのフォルダー編成と粒度がサポートされていますか。

複数の Power BI ワークスペースを 1 つの Azure Synapse ワークスペースにリンクすることはできますか。

Azure Cosmos DB への Azure Synapse Link は一般提供されていますか?

Azure Synapse Link for SQL は一般提供されていますか?

Azure Synapse ワークスペースでは CI/CD がサポートされていますか。

専用 SQL プールとサーバーレス プールの機能にはどのような違いがありますか。

Delta テーブルとは何ですか。なぜ使用する必要があるのでしょうか。

自動圧縮とは何ですか。

Pipelines

パイプラインの実行に使用されている資格情報を確認するにはどうすればよいですか。

SSIS IR は Synapse 統合でサポートされていますか。

Azure Data Factory パイプラインと Azure Synapse パイプラインにはどのような違いがありますか。

既存のパイプラインを Azure Data Factory から Azure Synapse ワークスペースに移行するにはどうすればよいですか。

Apache Spark ジョブ定義を使用するにはどうすればよいですか。

ADF パイプラインからノートブックを呼び出せますか。

Apache Spark

Synapse 用 Apache Spark と Apache Spark の違いは何ですか。

Spark のどのバージョンを使用できますか。

Azure Synapse Spark には、DButils に相当するものがありますか。

Apache Spark でセッション パラメーターを設定するにはどうすればよいですか。

サーバーレス Spark プールでクラスター レベルのパラメーターを設定するにはどうすればよいですか。

Azure Synapse Analytics でマルチユーザー Spark クラスターを実行することは可能ですか。

ライブラリを追加、管理、インストールする方法を教えてください。

Synapse Spark ではどのようなツールを利用できますか。

専用 SQL プール

専用 SQL プール (旧称 SQL DW) と Azure Synapse ワークスペースの専用 SQL プールの違いは何ですか。

専用 SQL プールとサーバーレス プールの機能にはどのような違いがありますか。

Azure Synapse の一般提供が開始されましたが、これまでスタンドアロンであった専用 SQL プールを Azure Synapse に移動するにはどうすればよいですか。

現在、専用 SQL プールの既定のデプロイはどのようになりますか。

ネットワークのセキュリティ

Azure Synapse ワークスペースへのアクセスをセキュリティで保護するにはどうすればよいですか。

次のステップ

フィードバック

その他のリソース

専用 SQL プールとサーバーレスプールの機能にはどのような違いがありますか。

Apache Spark でセッションパラメーターを設定するにはどうすればよいですか。

サーバーレス Spark プールでクラスターレベルのパラメーターを設定するにはどうすればよいですか。

専用 SQL プールとサーバーレスプールの機能にはどのような違いがありますか。