Microsoft Fabric でエンドツーエンド AI サンプルを使用する

Microsoft Fabric での Synapse Data Science のサービスとしてのソフトウェア(SaaS) エクスペリエンスにより、機械学習プロフェッショナルは、他の主要な役割と共同作業しながら 1 つの分析プラットフォームで機械学習モデルを構築、デプロイ、運用できるようになります。 この記事では、Synapse Data Science エクスペリエンスの機能と、機械学習モデルが一般的なビジネス上の問題に対処する方法の両方について説明します。

Python ライブラリをインストールする

一部のエンド ツー エンドの AI サンプルには、機械学習モデルの開発またはアドホック データ分析用の他のライブラリが必要です。 次のいずれかのオプションを選択して、Apache Spark セッション用のこれらのライブラリを簡単にインストールできます。

インライン インストール機能を使用してインストールする

ノートブックで Python インライン インストール機能 (%pip%conda など) を使用して、新しいライブラリをインストールします。 このオプションでは、ライブラリは現在のノートブックにのみインストールされます。ワークスペースにはインストールされません。 このコードを使用して、ライブラリをインストールします。 <library name> をライブラリの名前 (imblearn または wordcloud) に置き換えます。

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

ワークスペースの既定のライブラリを設定する

ワークスペース内のすべてのノートブックでライブラリを使用できるようにするには、その目的で Fabric 環境を使用できます。 環境を作成してライブラリをインストールすると、ワークスペース管理者は既定の環境としてワークスペースに環境をアタッチできます。 ワークスペースの既定値として環境を設定する方法の詳細については、管理者がワークスペースの既定のライブラリを設定するに関する記事を参照してください。

重要

ワークスペース設定でのライブラリ管理はサポートされなくなりました。 「ワークスペース ライブラリと Spark プロパティを既定の環境に移行する」に従って、既存のワークスペース ライブラリを環境に移行し、ワークスペースの既定値としてアタッチできます。

チュートリアルに従って機械学習モデルを作成する

これらのチュートリアルでは、一般的なシナリオのエンド ツー エンドのサンプルを提供します。

顧客離反

銀行の顧客が離反するかどうかを予測するモデルを構築します。 チャーン レートは解約率とも呼ばれ、顧客が銀行との取引を停止する割合を指します。

顧客離反の予測」のチュートリアルに従ってください。

推奨事項

あるオンライン書店では、カスタマイズされたレコメンデーションを提供することで、売上を増やしたいと考えています。 顧客の書籍の評価データを使用すると、予測を行うレコメンデーション モデルを開発してデプロイできます。

リテール レコメンデーション モデルのトレーニングに関するチュートリアルに従ってください。

不正行為の検出

不正な取引が増加するにつれて、リアルタイムのクレジット カード不正検出により、金融機関は、顧客に対し解決までの時間を短縮することができます。 不正検出モデルには、前処理、トレーニング、モデル ストレージ、推論が含まれます。 トレーニング パートでは、誤検知と偽陰性の間の不均衡な例やトレードオフなどの課題に対処する複数のモデルとメソッドの実装について確認します。

不正行為の検出に関するチュートリアルに従ってください。

予測

ニューヨーク市の不動産販売の履歴データと Facebook Prophet を使用して、傾向と季節性の情報を含む時系列モデルを構築し、将来のサイクルでの売上を予測します。

時系列予測に関するチュートリアルに従ってください。

テキスト分類

Word2vec と Spark の線形回帰モデルを使用してテキスト分類を適用し、書籍のメタデータに基づいて大英図書館の書籍がフィクションかノンフィクションかを予測します。

テキスト分類のチュートリアルに従ってください。

アップリフト モデル

アップリフト モデルを使用して、特定の医療処置が個人のビヘイビアーに与える因果関係を推定します。 これらのモジュールの 4 つのコア領域について触れます。

  • データ処理モジュール: 特徴、治療、ラベルを抽出します。
  • トレーニング モジュール: 従来の機械学習モデル (LightGBM など) を使用して、治療を受けた場合と治療を受けていない場合の個人のビヘイビアーの違いを予測します。
  • 予測モジュール: テスト データの予測のために、アップリフト モデルを呼び出します。
  • 評価モジュール: アップリフト モデルがテスト データに与える影響を評価します。

医療処置の因果関係に関するチュートリアルに従ってください。

予防保全

温度や回転数などの機械的故障を予測するために、履歴データに対して複数のモデルをトレーニングします。 次に、将来の故障を予測するのに最適なモデルを決定します。

予防保全に関するチュートリアルに従ってください。

売上予測

スーパーストア製品カテゴリの将来の売上を予測します。 履歴データに対してモデルをトレーニングして、これを行います。

売上予測に関するチュートリアルに従ってください。