データの指数関数的な増加に伴い、企業はデータのスケーリング、ストリーミング、予測、および表示のために、Azure の無限のコンピューティング、ストレージ、分析能力に依存しています。 分析ソリューションによって大量のデータが、レポートや視覚化などの有用なビジネス インテリジェンス (BI) や、機械学習に基づく予測などの独創的な人工知能 (AI) に変わります。
クラウドベースの分析ツールの評価を開始したばかりの組織や、現在の実装の拡張を求める組織のどちらであっても、Azure であれば、多くのオプションが用意されています。 このワークフローは、一般的なアプローチについて学習し、プロセスとロールをクラウドの考え方に合わせて調整する作業から始まります。
データは、バッチやリアルタイムで、オンプレミスやクラウドで処理できますが、すべての分析ソリューションの目的は、データを大規模に役立てられるようにすることです。 組織が人、マシン、モノのインターネット (IoT) によって生成されるすべてのリレーショナル データと非リレーショナル データに対して、信頼できる単一の情報源を構築する必要性はますます高まっています。 ビッグ データ アーキテクチャまたは IoT アーキテクチャを使用して生データを構造化された形式に変換し、分析データ ストアに移動するのが一般的です。 このストアは、多数の分析情報ソリューションに力を与える信頼できる単一の情報源になります。
アーキテクチャ
このアーキテクチャの Visio ファイル をダウンロードします。
上の図は、一般的な基本的/ベースライン分析の実装を示しています。 Azure で構築できる実際のソリューションについては、このセクションで提供される アーキテクチャ を参照してください。
分析のアーキテクチャとガイドを調べる
このセクションの記事には、Azure にデプロイし、運用グレードのソリューションとガイドに拡張できる、完全に開発されたアーキテクチャが含まれています。 これらは、Azure での分析テクノロジの使用方法に関する重要な決定を下すのに役立ちます。 また、ソリューションのアイデアを確認することもできます。分析 POC 開発を計画する際に可能な内容を確認できます。
アーキテクチャ
- Microsoft Fabric を使用したエンドツーエンドの分析 - Microsoft Fabric の統合機能を使用して最新の分析プラットフォームを構築します。
- データ ウェアハウスと分析 - 複数のソースからの大量のデータを統合された分析プラットフォームに統合します。
- Microsoft Fabric を使用してエンタープライズ BI ソリューションを設計する - Microsoft Fabric を使用してエンタープライズ ビジネス インテリジェンス ソリューションを設計します。
- ほぼリアルタイムの Lakehouse データ処理 - ほぼリアルタイムのデータレイクハウス処理には、Azure Synapse Analytics と Azure Data Lake Storage を使用します。
- MongoDB Atlas から Azure Synapse Analytics へのリアルタイム同期 - MongoDB Atlas データを Azure Synapse Analytics にリアルタイムで同期します。
- Azure Databricks を使用したストリーム処理 - Azure Databricks を使用してエンドツーエンドのストリーム処理パイプラインを作成します。
- Azure Stream Analytics を使用したストリーム処理 - データを取り込み、レコードを関連付け、ローリング平均を計算するストリーム処理パイプラインを構築します。
- 中小企業向けの最新のデータ ウェアハウス - 中小企業向けに設計された最新のデータ ウェアハウス ソリューションを構築します。
ソリューションのアイデア
- Azure Databricks を使用したインジェスト、ETL、ストリーム処理パイプライン - データ レイクの取り込みを簡略化するために、バッチ データとストリーミング データ用の ETL パイプラインを作成します。
- Azure Databricks を使用した最新の分析アーキテクチャ - 最新のデータ アーキテクチャを使用してデータを収集、処理、分析、視覚化します。
- 中小企業向けの最新のデータ プラットフォーム - Microsoft Fabric と Azure Databricks を使用して、中小企業向けの最新のデータ プラットフォーム アーキテクチャを構築します。
- Azure Data Explorer を使用したリアルタイム分析 - Azure Data Explorer と Azure Service Bus を使用してリアルタイムでデータを分析します。
Guides
テクノロジの選択
- 分析とレポート - Azure でのデータ分析と視覚化のオプションを比較します。
- バッチ処理 - ビッグ データ ワークロードのバッチ処理テクノロジを評価します。
- ストリーム処理 - リアルタイム分析のためのストリーム処理テクノロジを比較します。
- 分析データ ストアの選択 - 適切な分析データ ストアの選択に関するガイダンス。
- Microsoft Fabric で分析データ ストアを選択する - Microsoft Fabric でのデータ ストアの選択に関するガイダンス。
Azure データ プラットフォームのディザスター リカバリー
- 概要 - Azure データ プラットフォームのディザスター リカバリー戦略の概要。
- アーキテクチャ - Azure データ プラットフォームでのディザスター リカバリーのアーキテクチャ パターン。
- シナリオの詳細 - ディザスター リカバリーを実装するための詳細なシナリオ。
- 推奨事項 - ディザスター リカバリーに関するベスト プラクティスの推奨事項。
Azure での分析について学習する
Azure での分析が初めての場合は、無料のオンライン トレーニング プラットフォームである Microsoft Learn が、学習を深めるために最適な場所です。 特定の製品やサービスに関するビデオ、チュートリアル、実践的な学習に加えて、開発者やデータ アナリストなどの職務に基づくラーニング パスが見つかります。
利用を開始するときに役立つリソースを次に示します。
ロール別のラーニング パス
- データ アナリスト: Microsoft データ分析の概要
- データ エンジニア: Azure Databricks を使用して Data Analytics ソリューションを実装する
- データ サイエンティスト: Azure Databricks を使用して機械学習ソリューションを構築する
組織の準備
組織がクラウドを初めて使用する場合は、クラウド導入フレームワークが立ち上げに役立ちます。 Microsoft が提供する実証済みのガイダンスであるドキュメントとベスト プラクティス オファーのコレクションであり、クラウド導入作業の時間が短縮されるように設計されています。 クラウド規模の分析の詳細については、 クラウド規模の分析に関するページを参照してください。
Azure での分析ソリューションの品質を確保するために、Azure Well-Architected Framework に従うことをお勧めします。 優れたアーキテクチャを求める組織向けに、規範的なガイダンスを提供し、コスト最適化された Azure ソリューションを設計、プロビジョニング、監視する方法について説明します。
Well-Architected Framework の柱に沿ったデータ ワークロード ガイダンスについては、 データ ワークロード用の Azure Well-Architected Framework に関するページを参照してください。
運用へのパス
データの格納方法を知るのは、Azure での分析を行う上で最初に行う必要がある決定の 1 つです。 その後、シナリオに最適な Data Analytics テクノロジを選択できます。
重要な決定ポイントは次のとおりです。
データ ストレージ: データ構造とクエリ パターンに基づいて、データ レイク、データ ウェアハウス、またはレイクハウスのいずれかを選択します。 分析ワークロードを強化するデータベース ソリューションの選択と設計に関するガイダンスについては、「 データベース アーキテクチャの設計」を参照してください。
処理モデル: バッチ処理、ストリーム処理、または組み合わせがワークロードの要件に最も適しているかどうかを判断します。
分析ツール: チームのスキルとビジネス ニーズに合った BI および AI テクノロジを選択します。
分析ソリューションのさまざまなアーキテクチャ スタイルを表示するには、 アーキテクチャを参照してください。
ベスト プラクティス
高品質の分析は、堅牢で信頼性の高いデータから始まります。 最高レベルの情報セキュリティ プラクティスは、データが転送中および保存中に保護されるのを保証するのに役立ちます。 そのデータへのアクセスも信頼されている必要があります。 信頼できるデータとは、設計に次が実装されていることを意味します。
ガバナンス ポリシー - 明確なデータの所有権、分類、アクセス ポリシーを定義します。
ID とアクセス管理 - ロールベースのアクセス制御と最小特権の原則を実装します。
ネットワーク セキュリティ制御 - サービス間のデータ フローを保護し、承認されていないアクセスを防ぎます。
データ保護 - 保存データと転送中のデータを暗号化します。
プラットフォーム レベルでは、次のビッグ データのベスト プラクティスが、Azure での信頼性の高い分析に役立ちます。
データ インジェストを調整 する - Azure Data Factory や Microsoft Fabric パイプラインでサポートされているようなデータ ワークフローまたはパイプライン ソリューションを使用します。
データのインプレース処理 - 分散データ ストアを使用します。ビッグ データ アプローチでは、大量のデータと幅広い形式をサポートします。
機密データを早期にスクラブ する - データ レイクに格納されないように、インジェスト ワークフローの一部として機密データを削除またはマスクします。
総コストを考慮 する - 必要なコンピューティング ノードのユニットごとのコストと、それらのノードを使用してジョブを完了する分単位のコストとのバランスを取る。
統合データ レイクの作成 - 構造化、半構造化、非構造化のいずれであっても、複数の形式のファイルのストレージを結合します。 Azure Data Lake Storage Gen2 を単一の信頼のソースとして使用します。 たとえば、センター オブ エクセレンスの BI ソリューション アーキテクチャに関するページを参照してください。
分析を最新の状態に保つ
Azure Analytics サービスは、最新のデータの課題に対処するために進化しています。 最新の更新プログラムと計画された機能に関する最新情報を入手します。
Azure の製品と機能に関する最新の更新プログラムを入手します。
次の主要な分析サービスを最新の状態に保ちます。
その他のリソース
Analytics は幅広いカテゴリであり、さまざまなソリューションを対象にしています。 次のリソースは、Azure の詳細を確認するのに役立ちます。
ハイブリッド
組織の大部分は、データがオンプレミスとクラウドの両方でホストされているので、分析に対するハイブリッドのアプローチを必要とします。 多くの場合、組織はオンプレミスのデータ ソリューションをクラウドに拡張します。 これらの環境を接続するには、組織はハイブリッド ネットワーク アーキテクチャを選択する必要があります。
主要なハイブリッド分析シナリオ:
- メインフレームの最新化: メインフレームとミッドレンジ のデータを最新化 する - 従来のデータ ソースを最新の分析プラットフォームと統合します。
- オンプレミス統合: 統合されたハイブリッド操作とマルチクラウド操作 - オンプレミスデータベースをクラウド分析に接続します。
- エッジ分析: エッジでデータを処理し、クラウドで分析情報を集計します。
リアルタイム分析
リアルタイム分析を使用すると、組織は到着したデータに対してアクションを実行できます。 Azure でのリアルタイム分析の開始に役立つリソースを次に示します。
- ビッグ データ アーキテクチャに関するリアルタイム分析 - ストリーミング データを大規模に処理および分析します。
- Azure Data Explorer を使用した IoT 分析 - IoT テレメトリ データをリアルタイムで分析します。
- Azure Stream Analytics を使用したストリーム処理 - サーバーレス ストリーミング ソリューションを構築します。
- Azure Databricks - Apache Spark を使用したエンタープライズ グレードの分析を使用して、最新の分析アーキテクチャを作成します。
分析のその他の例を Azure アーキテクチャ センターで参照
AWS または Google Cloud プロフェッショナル
これらの記事は、Azure 分析オプションを他のクラウド サービスと比較することで、立ち上げを迅速に行うのに役立ちます。