複数のソースからのデータを結合する方法を確認する

完了

事業で仕入先を選択できるようにするには、品質データと納期達成メトリックが必要です。 共同分析を行うために Cosmos DB の QA データを SAP ビジネス データと組み合わせるのは、このためです。 これまでのアクティビティをおさらいすると次のようになります。

  1. Azure Synapse Studio ワークスペースを設定しました。
  2. SAP Business Warehouse へのリンクを作成して、仕入先の購入データを取り込みました。
  3. Cosmos DB へのリンクを作成して、仕入先の品質データを取り込みました。
  4. 次に、そのデータを取り込み、結合します。 この重要な手順を使用すると、結合されたレコードに対して履歴分析や予測分析を実行できます。

次に、設定中に Azure Synapse Studio ワークスペースによって自動的に作成された専用の SQL プールを使用します。

SQL スクリプトとパイプライン

結合されたデータを格納するための専用の SQL プールで作業しているため、Synapse Studio の SQL スクリプト機能を使用して SQL クエリを作成します。 柔軟な SQL スクリプト Web インターフェイスを使用すると、新しいスクリプトを開発したり、既存のスクリプトを使用または変更したり、サンプル ギャラリーからスクリプトを選択したりできます。

Azure Synapse Analytics のパイプラインでは、Azure Data Factory サービスと同様に、データ統合を実行します。 パイプラインによって、データが専用の SQL プールにプルされます。 SQL プールは、PREDICT 関数を使用したネイティブの Transact-SQL (T-SQL) 分析および予測分析のためのデータ ソースとして機能します。 Transact-SQL (T-SQL) は、リレーショナル データベースとの対話を可能にする、SQL に対する Microsoft の独自の拡張機能です。

パイプラインのビルドと実行

パイプラインをビルドして実行し、2 つのリンク サービスを使用してデータを取り込むには、Synapse Studio の [統合ハブ] に移動します。

+ を選択し、[パイプライン] を選択します。 Synapse Studio により、ドラッグ アンド ドロップのパイプライン キャンバスが開きます。 必要なアクションをドラッグし、プロパティを設定します。 必要に応じて、[OK] を選択してデバッグします。 [パイプラインの実行] を選択すると、データ ソースから専用の SQL プールにデータがコピーされます。

パイプラインを 1 回実行することも、1 日に 1 回パイプラインを実行するスケジュールを作成することもできます。 パイプラインを実行するたびに、データ ソースから更新されたデータが追加されます。

要約

分析のためにデータを結合するには、Synapse Studio でパイプラインを実行します。 Synapse では、2 つのソースから適切なデータを抽出し、データを変換し、SQL スクリプト インターフェイスを使用して、分析と機械学習の準備が整った専用の SQL プールに配置します。