基礎から分かるマイクロソフトの統計分析・機械学習ソリューション
Microsoft Japan Data Platform Tech Sales Team
倉重 秀昭
マイクロソフトでは、Power BI に代表される Business Intelligence(BI) ソリューションの他にも、統計分析や機械学習ソリューションも提供しています。
統計分析や機械学習と聞くと 「難しそう!」 と感じる方も多いと思いますが、マイクロソフトでは使う方の技術レベルに合わせて様々な分析ツールを用意し、ビジネスユーザから統計技術者まで、いろいろなレベルのお客様が無理なく分析できるソリューションを提供しています。
これから本 Blog や連動する各種媒体を通じて、マイクロソフトの統計分析と機械学習ソリューションについて、分かりやすく基礎からご紹介していきたいと思います。
今回は第一回目として、マイクロソフトが提供する「統計分析」「機械学習」向けのソリューションと特徴についてご紹介いたします。
■ BI・統計分析・機械学習の違い
まず、ツールの紹介をする前に、BI・統計分析・機械学習がどのような分析手法なのかを整理してみたいと思います。
- Business Intelligence (BI)
定型レポートや Excel のピボット分析などによりデータの可視化を行い、データの特徴やルールを発見する分析手法です。
- 統計分析
統計学的手法を適用して、データの特徴やルールを発見する分析手法です。
(例:ある商品と一緒に買われている商品を導出(併売分析))
- 機械学習
統計学的手法を用いて、コンピューターに実績データからルールや相関関係を学習させ、その内容を元に将来の予測を行う分析手法です。分析の目的が「予測」である事が統計分析との主な違いです。
(例:会員の行動パターンから、近い将来、退会しそうなお客様を予測する(離脱予測))
※分析手法の分類や定義には諸説あり、上記以外の分類・定義をする場合もあります。
次に、マイクロソフトが提供している「統計分析」と「機械学習」ソリューションとその特徴についてご紹介します。
■ マイクロソフトの統計分析ソリューション
まず、統計分析ですが、利用される方の技術レベルに合わせて、主に以下の2つのソリューションを提供しています。
- データマイニング add-in for Excel
ビジネスユーザ向けの統計分析ツールです。
Excel を使い、統計分析を勉強したことが無いユーザでも簡単に統計分析を行う事が可能です。クライアントツールとして Excel を使いますが、マシンパワーを必要とする分析処理はサーバー(SQL Server Analysis Services)側で行います。
- SQL Server 2016 R Services / Microsoft R Server
データサイエンティスト向けの統計分析基盤です。
昨今、統計分析で最もよく使われている R 言語のマイクロソフト版ディストリビューションで、オープンソース版 R 言語の最大の課題である処理パフォーマンスを大幅に向上させることが可能です。
■ マイクロソフトの機械学習ソリューション
次に機械学習ですが、こちらも以下の2つのソリューションを提供しています。
- Microsoft Cognitive Services
画像認識や音声認識などの学習済みの汎用モデルを SaaS として提供しています。
以下のサイトから、試用する事ができます。 https://www.microsoft.com/cognitive-services
- Microsoft Azure Machine Learning
Azure 上で PaaS として提供する機械学習ソリューションです。
マイクロソフトでは、ビジネスにおいて機械学習で効果を上げるには、汎用モデルを利用するだけではなく、独自の機械学習予測モデルを作成し、活用する事が必要不可欠だと考えています。
Azure Machine Learning を利用すると、独自の機械学習予測モデルの開発と、予測モデルの様々なシステムへの組み込みを、簡単かつ低価格で実現できるようになります。
次回は 各ソリューションのさらに深堀した特徴について、DB Online の連載「SQL Server 入門」にてご紹介する予定です。