Azure Synapse Analytics とは

Azure Synapse は、データ ウェアハウスやビッグ データ システム全体にわたって分析情報を取得する時間を早めるエンタープライズ分析サービスです。 Azure Synapse は、エンタープライズ データ ウェアハウスで使用される SQL テクノロジ、ビッグ データのための Spark テクノロジ、ログおよび時系列分析に使用される Data Explorer、データ統合と ETL および ELT のための PipelinesPower BICosmosDBAzureML などの他の Azure サービスとの緊密な統合の長所を組み合わせたものです。

Diagram of Azure Synapse Analytics architecture.

業界最高水準の SQL

Synapse SQL は、T-SQL の分散クエリ システムです。データ ウェアハウジングやデータ仮想化のシナリオが可能となるほか、T-SQL を拡張してストリーミングや機械学習のシナリオにも対応することができます。

  • Synapse SQL では、サーバーレス専用の両方のリソース モデルが提供されます。 予測可能なパフォーマンスとコストに対しては、専用 SQL プールを作成して、SQL テーブルに格納されているデータの処理能力を確保します。 計画外または突発性のワークロードに対しては、常に使用可能なサーバーレスの SQL エンドポイントを使用します。
  • 組み込みのストリーミング機能を使用して、クラウド データ ソースから SQL テーブルにデータを取り込みます
  • 機械学習モデルを使用し、T-SQL PREDICT 関数を使用してデータをスコア付けすることにより、AI を SQL と統合します

業界標準の Apache Spark

Apache Spark for Azure Synapse は、Apache Spark と密にシームレスに統合されます。Apache Spark は、データ準備、データ エンジニアリング、ETL、および機械学習に使用される最も人気のあるオープン ソースのビッグ データ エンジンです。

  • SparkML アルゴリズムを使用した ML モデルと、Linux Foundation Delta Lake の組み込みサポートを備える Apache Spark 3.1 用の AzureML 統合。
  • クラスターの管理について心配する必要からユーザーを解放する、簡素化されたリソース モデル。
  • Spark の迅速なスタートアップと積極的な自動スケーリング。
  • Spark 向け .NET の組み込みサポートにより、C# の専門知識と既存の .NET コードを Spark アプリケーション内で再利用できます。

データ レイクの操作

Azure Synapse は、SQL と Spark を組み合わせて使用する場合の従来のテクノロジーの障害を取り除きます。 ニーズと専門知識に基づいて、シームレスにいろいろな組み合わせを使用することができます。

  • データ レイク内のファイルで定義されたテーブルを、Spark または Hive でシームレスに使用できます。
  • SQL と Spark を使用して、データ レイクに保存されている Parquet、CSV、TSV、JSON ファイルを直接探索して分析できます。
  • SQL データベースと Spark データベース間の高速かつスケーラブルなデータ読み込み

組み込みのデータ統合

Azure Synapse には Azure Data Factory と同じデータ統合エンジンとエクスペリエンスが含まれているため、Azure Synapse Analytics から離れることなく、多機能で大規模な ETL パイプラインを作成できます。

  • 90 以上のデータ ソースからデータを取り込む
  • データ フロー アクティビティを使用したコードフリーの ETL
  • ノートブック、Spark ジョブ、ストアド プロシージャ、SQL スクリプトなどを調整する

Data Explorer (プレビュー)

Azure Synapse Data Explorer は、ログとテレメトリ データから分析情報を引き出すための対話型クエリ エクスペリエンスを顧客に提供します。 既存の SQL および Apache Spark 分析ランタイム エンジンを補完するために、Data Explorer の分析ランタイムは、効率的なログ分析用に最適化されており、強力なインデックス作成テクノロジを使用して、テレメトリ データに一般的なフリーテキスト データと半構造化データのインデックスを自動的に作成します。

Data Explorer を、準リアルタイムのログ分析と IoT 分析ソリューションを構築するためのデータ プラットフォームとして使うことで、次のことを実現します。

  • オンプレミス、クラウド、サードパーティのデータ ソース間でログとイベントのデータを統合し、関連付けます。
  • AI Ops の体験を促進します (パターン認識、異常検出、予測など)。
  • インフラストラクチャベースのログ検索ソリューションを置き換えて、コストを節約し、生産性を向上させます。
  • IoT データ用の IoT 分析ソリューションを構築します。
  • 内部および外部の顧客にサービスを提供する分析 SaaS ソリューションを構築します。

統合エクスペリエンス

Synapse Studio は、ソリューションの構築、保守、セキュリティ保護をすべて 1 つのユーザー エクスペリエンスで行う単一の手段を企業に提供します。

  • 主要なタスク (取り込み、調査、準備、調整、視覚化) を実行する
  • SQL、Spark、および Data Explorer 全体でリソース、使用状況、ユーザーを監視する
  • ロールベースのアクセス制御を使用して分析リソースへのアクセスを単純化する
  • SQL、Spark、または KQL コードを記述し、エンタープライズ CI/CD プロセスと統合する

Synapse コミュニティへの参加

次の手順