PREDICT を使用した機械学習モデルのスコア付け

Tip

Microsoft Fabric Data Warehouse は、将来のアーキテクチャ、組み込みの AI、および新機能を備えた、Data Lake 基盤上のエンタープライズ規模のリレーショナルウェアハウスです。データウェアハウスを初めて使用する場合は、Fabric Data Warehouseから始めます。既存の dedicated SQL プールワークロードは、Fabric にアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Fabric Data Warehouse 用マイグレーションアシスタント

専用 SQL プールには、使い慣れた T-SQL 言語を使用して機械学習モデルをスコア付けする機能が用意されています。 T-SQL PREDICT を使用すると、履歴データでトレーニングされた既存の機械学習モデルを、ご自分のデータウェアハウスのセキュリティで保護された境界内に持ち込んでスコア付けすることができます。 PREDICT 関数によって、入力として ONNX (Open Neural Network Exchange) モデルとデータが受け取られます。この機能により、重要なデータをスコアリングのためにデータウェアハウスの外部に移動する手順が不要になります。これは、データプロフェッショナルが使い慣れた T-SQL インターフェイスを使用して機械学習モデルを簡単にデプロイできるようにするだけでなく、タスクに適切なフレームワークを使用してデータサイエンティストとシームレスに共同作業できるようにすることを目的としています。

Note

現在、この機能はサーバーレス SQL プールではサポートされていません。

この機能には、モデルが Synapse SQL の外部でトレーニングされている必要があります。モデルを構築したら、それをデータウェアハウスに読み込んで、T-SQL PREDICT 構文でスコア付けし、データから分析情報を得ます。

predictoverview

モデルのトレーニング

専用 SQL プールでは、事前トレーニング済みのモデルが想定されています。専用 SQL プールで予測を実行するために使用される機械学習モデルをトレーニングするときは、次の点に留意してください。

専用 SQL プールでサポートされているのは ONNX 形式のモデルのみです。 ONNX は、さまざまなフレームワーク間でモデルを交換して相互運用性を実現できるオープンソースモデル形式です。既存のモデルを ONNX 形式に変換するには、それをネイティブにサポートしているフレームワークか、変換パッケージを利用できるフレームワークを使用します。たとえば、sklearn-onnx パッケージでは、scikit-learn モデルが ONNX に変換されます。 ONNX GitHub リポジトリによって、サポートされているフレームワークと例のリストが提供されます。

トレーニングに自動 ML を使用している場合は、enable_onnx_compatible_models パラメーターが TRUE に設定されていることを確認し、ONNX 形式モデルを生成します。自動機械学習ノートブックには、自動 ML を使用して ONNX 形式の機械学習モデルを作成する方法の例が示されています。
入力データに対しては、次のデータ型がサポートされています。
- int、bigint、real、float
- char、varchar、nvarchar
スコアリングデータは、トレーニングデータと同じ形式である必要があります。多次元配列などの複合データ型は、PREDICT ではサポートされていません。そのため、トレーニングでは、すべての入力を含む単一の配列を渡すのではなく、モデルの各入力がスコアリングテーブルの 1 つの列に対応していることを確認してください。
モデル入力の名前とデータ型が、新しい予測データの列名とデータ型と一致していることを確認します。オンラインで入手できるさまざまなオープンソースツールを使用して ONNX モデルを視覚化すると、デバッグにさらに役立ちます。

モデルを読み込む

モデルは、16 進数の文字列として専用 SQL プールユーザーテーブルに格納されます。モデルを識別するために、ID や説明などの追加の列をモデルテーブルに追加することができます。モデル列のデータ型として varbinary(max) を使用します。モデルの格納に使用できるテーブルのコード例を次に示します。

-- Sample table schema for storing a model and related data
CREATE TABLE [dbo].[Models]
(
    [Id] [int] IDENTITY(1,1) NOT NULL,
    [Model] [varbinary](max) NULL,
    [Description] [varchar](200) NULL
)
WITH
(
    DISTRIBUTION = ROUND_ROBIN,
    HEAP
)
GO

モデルが 16 進数の文字列に変換され、テーブル定義が指定されたら、COPY コマンドまたは Polybase を使用して、モデルを専用 SQL プールテーブルに読み込みます。次のコードサンプルでは、Copy コマンドを使用してモデルを読み込みます。

-- Copy command to load hexadecimal string of the model from Azure Data Lake storage location
COPY INTO [Models] (Model)
FROM '<enter your storage location>'
WITH (
    FILE_TYPE = 'CSV',
    CREDENTIAL=(IDENTITY= 'Shared Access Signature', SECRET='<enter your storage key here>')
)

モデルを評価する

モデルとデータがデータウェアハウスに読み込まれたら、T-SQL PREDICT 関数を使用してモデルをスコア付けします。新しい入力データが、モデルの構築に使用したトレーニングデータと同じ形式であることを確認します。 T-SQL PREDICT によって、モデルと新しいスコアリング入力データの 2 つの入力が受け取られ、出力用の新しい列が生成されます。モデルは、変数、リテラル、またはスカラー sub_query として指定できます。 WITH common_table_expression を使用して、データパラメーターの名前付き結果セットを指定します。

次の例は、予測関数を使用したサンプルクエリを示しています。予測結果を含む Score という名前の追加の列と、データ型 float が作成されます。すべての入力データ列と出力予測列が、SELECT ステートメントで表示できるようになります。詳細については、「PREDICT (Transact-SQL)」を参照してください。

-- Query for ML predictions
SELECT d.*, p.Score
FROM PREDICT(MODEL = (SELECT Model FROM Models WHERE Id = 1),
DATA = dbo.mytable AS d, RUNTIME = ONNX) WITH (Score float) AS p;

次のステップ

PREDICT 関数の詳細については、「PREDICT (Transact-SQL)」を参照してください。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-05-03