Azure Synapse Analytics 専用 SQL プールへデータ ウェアハウスを移行する
次のセクションでは、既存のデータ ウェアハウス ソリューションを Azure Synapse Analytics 専用 SQL プール (以前の SQL Data Warehouse) に移行するとき、何が必要になるかについて概説します。
概要
移行を開始する前に、Azure Synapse Analytics がご自分のワークロードに最適なソリューションであることを確認する必要があります。 Azure Synapse Analytics は、大規模なデータの分析を目的として設計された分散システムです。 Azure Synapse Analytics に移行するには、理解するのは難しくなくても実装するのに多少時間がかかる設計変更が必要です。 ビジネスでエンタープライズ クラスのデータ ウェアハウスが必要な場合は、労力に見合うだけの利点があります。 一方、Azure Synapse Analytics ほどの能力を必要としない場合は、SQL Server または Azure SQL Database を使う方が高い費用対効果を得られます。
Azure Synapse Analytics の使用を検討するのは、次のようなときです。
- 1 テラバイト以上のデータがある。
- かなりの量のデータで分析することを計画している。
- コンピューティングおよびストレージをスケーリングできる必要がある。
- 必要のないときはコンピューティング リソースを一時停止してコストを節約したい。
次のような運用オンライン トランザクション処理 (OLTP) ワークロードの場合は、Azure Synapse Analytics でなく、他の選択肢を検討してください。
- 読み取りと書き込みの頻度が高い。
- 単一選択の数が多い。
- 単一行挿入の量が多い。
- 行単位の処理が必要である。
- 互換性のない形式 (JSON、XML など)。
移行前
既存のソリューションを Azure Synapse Analytics に移行することを決定したら、作業を開始する前に移行を計画することが必要です。 計画の主な目的は、データ、テーブル スキーマ、およびコードで Azure Synapse Analytics との互換性を確保することです。 現在のシステムと Azure Synapse Analytics には、対処する必要がある互換性の相違がいくつかあります。 さらに、大量のデータを Azure に移行するには時間がかかります。 綿密な計画を立てることで、データを Azure に移行するプロセスを高速化できます。
計画のもう 1 つの重要な目的は、Azure Synapse Analytics で提供するよう意図されている高いクエリ パフォーマンスをソリューションで最大限に活用できるように設計を調整することです。 拡張性を考えてデータ ウェアハウスを設計すると独自の設計パターンが導入されるため、従来の手法が常に最適であるとは限りません。 一部の設計の調整を移行の後で行うことはできますが、プロセスの早い段階で変更を行えば、後で時間を節約できます。
Migrate
移行を成功させるには、テーブル スキーマ、コード、データを移行する必要があります。 これらのトピックに関する詳細なガイダンスについては、以下の記事をご覧ください。
その他のリソース
Netezza または Teradata から Azure Synapse Analytics への移行の具体的な詳細については、移行に関する 7 つの記事から成るシーケンスの最初の手順から始めます。
実際の取り組みから得られる移行資産
この移行シナリオの詳細については、次のリソースをご覧ください。 これらは、実際の移行プロジェクトの取り組みをサポートするために開発されました。
タイトルとリンク | 説明 |
---|---|
データ ワークロード評価モデルとツール | このツールを使用すると、特定のワークロードに対して、推奨される "最適な" ターゲット プラットフォーム、クラウドの準備状況、アプリケーションまたはデータベースの修復レベルがわかります。 シンプルなワンクリックの計算とレポート生成機能があり、自動化された均一なターゲット プラットフォームの決定プロセスが用意されているので、大規模な不動産評価を加速させることができます。 |
Azure Synapse Analytics へのデータの読み込み中に発生するデータ エンコードに関する問題の処理 | このブログ投稿では、データ エンコードの一部に問題に関する分析情報を提供しています。この問題は、PolyBase を使用してデータを専用 SQL プール (以前の SQL Data Warehouse) に読み込むときに発生する可能性があります。 この記事では、こうした問題を解決してデータを正常に読み込むために使用できるいくつかの選択肢についても説明しています。 |
Azure Synapse Analytics 専用 SQL プールでのテーブル サイズの取得 | アーキテクトが実行する必要のある主なタスクの 1 つは、移行後の新しい環境に関するメトリックを取得することです。 たとえば、オンプレミスからクラウドへの読み込み時間の収集、PolyBase の読み込み時間の収集などです。 最も重要なタスクの 1 つは、お客様の現在のプラットフォームと比較して、専用 SQL プール (以前の SQL Data Warehouse) のストレージ サイズを決定することです。 |
データ SQL エンジニアリング チームが、これらのリソースを開発しました。 このチームの主要な作業は、Microsoft の Azure データ プラットフォームへのデータ プラットフォーム移行プロジェクトの複雑な近代化を容易にし、迅速に進めることです。
ビデオ
Walgreens が、約 100 TB のデータがある小売り在庫システムを記録的な速さで Netezza から Azure Synapse Analytics に移行した方法をご覧ください。
ヒント
Synapse の移行の詳細については、「Azure Synapse Analytics 移行ガイド」を参照してください。