複数のソースからのデータを結合する方法を確認する
事業で仕入先を選択できるようにするには、品質データと納期達成メトリックが必要です。 共同分析を行うために Cosmos DB の QA データを SAP ビジネス データと組み合わせるのは、このためです。 これまでのアクティビティをおさらいすると次のようになります。
- Azure Synapse Studio ワークスペースを設定しました。
- SAP Business Warehouse へのリンクを作成して、仕入先の購入データを取り込みました。
- Cosmos DB へのリンクを作成して、仕入先の品質データを取り込みました。
- 次に、そのデータを取り込み、結合します。 この重要な手順を使用すると、結合されたレコードに対して履歴分析や予測分析を実行できます。
次に、設定中に Azure Synapse Studio ワークスペースによって自動的に作成された専用の SQL プールを使用します。
SQL スクリプトとパイプライン
結合されたデータを格納するための専用の SQL プールで作業しているため、Synapse Studio の SQL スクリプト機能を使用して SQL クエリを作成します。 柔軟な SQL スクリプト Web インターフェイスを使用すると、新しいスクリプトを開発したり、既存のスクリプトを使用または変更したり、サンプル ギャラリーからスクリプトを選択したりできます。
Azure Synapse Analytics のパイプラインでは、Azure Data Factory サービスと同様に、データ統合を実行します。 パイプラインによって、データが専用の SQL プールにプルされます。 SQL プールは、PREDICT 関数を使用したネイティブの Transact-SQL (T-SQL) 分析および予測分析のためのデータ ソースとして機能します。 Transact-SQL (T-SQL) は、リレーショナル データベースとの対話を可能にする、SQL に対する Microsoft の独自の拡張機能です。
パイプラインのビルドと実行
パイプラインをビルドして実行し、2 つのリンク サービスを使用してデータを取り込むには、Synapse Studio の [統合ハブ] に移動します。
+ を選択し、[パイプライン] を選択します。 Synapse Studio により、ドラッグ アンド ドロップのパイプライン キャンバスが開きます。 必要なアクションをドラッグし、プロパティを設定します。 必要に応じて、[OK] を選択してデバッグします。 [パイプラインの実行] を選択すると、データ ソースから専用の SQL プールにデータがコピーされます。
パイプラインを 1 回実行することも、1 日に 1 回パイプラインを実行するスケジュールを作成することもできます。 パイプラインを実行するたびに、データ ソースから更新されたデータが追加されます。
要約
分析のためにデータを結合するには、Synapse Studio でパイプラインを実行します。 Synapse では、2 つのソースから適切なデータを抽出し、データを変換し、SQL スクリプト インターフェイスを使用して、分析と機械学習の準備が整った専用の SQL プールに配置します。