この記事では、予測モデリングで使用するために、デジタル ツイン ビルダー (プレビュー) のオントロジ データと機械学習 (ML) の統合に関連する内容について説明します。 アナリストとデータ サイエンティストは、 自動 ML (AutoML) モデルまたはカスタム ML モデルを使用して、運用データのセマンティック リレーションシップから値を抽出できます。
Von Bedeutung
この機能は プレビュー段階です。
ML でデジタル ツイン ビルダーオントロジを使用する理由
デジタル ツイン ビルダー (プレビュー) で表されるオントロジ データは、次の方法で ML モデルを強化します。
- 生のセンサー データにコンテキストを提供する (センサーを機器にリンクするなど)
- 構造化された知識を使用した特徴エンジニアリングの改善
- ドメインリレーションシップを組み込むことによるモデルの精度の向上
ML でオントロジ データを使用する手順
次のセクションでは、ML ワークフローでデジタル ツイン ビルダー (プレビュー) のオントロジ データを使用する場合の一般的な手順について説明します。
手順 1: オントロジ データの取り込み
まず、オントロジ データをクエリ可能な形式にプルする必要があります。 Ontology データには、通常、次のものが含まれます。
- エンティティ インスタンス間のリレーションシップ インスタンス (どのセンサーがどの機器に属するかなど)
- 階層マッピング ( 生産ライン > 機器 > センサーなど)
- 静的メタデータ (機器の種類、場所、運用上の制限など)
次のグラフはオントロジ データの例を表しています。
センサー識別子 | 機器 ID | 機器の種類 | 生産ライン | サイト |
---|---|---|---|---|
S001 | D101 | 蒸留 器 | 行 A | サイト A |
S002 | C201 | コンデンサー | ライン B | サイト B |
このデータを強化して使用する方法を次に示します。
- 時系列データと結合して、生センサーの読み取りにコンテキストを追加する
- 関係インスタンスの集計 (各機器のセンサー数の収集など)
- 階層でフィルター処理する (特定のプラントの場所で障害などのデータを分離できます)
手順 2: ML のオントロジ データの変換
オントロジ データが使用可能になったら、ML モデルで使用できるように変換できます。
このプロセスには以下のような活動が含まれる場合があります。
- 時系列データとの結合 (時系列センサーの読み取り値など)
- 新機能の派生 (平均機器の温度や圧力の傾向など)
- カテゴリ別特徴の作成 (機器の種類や冷却媒体など)
次のグラフは、特徴エンジニアリングを経たオントロジ データの例を示しています。
プロセス ID | 機器 ID | 失敗 | 平均圧力 | 冷却の種類 | サイト |
---|---|---|---|---|---|
DP001 | D101 | いいえ | 1.5 bar | 空冷 | サイト A |
DP002 | C201 | イエス | 2.3 bar | 水冷式 | サイト B |
この段階では、オントロジ データを ML モデルで使用する準備が整いました。
手順 3: AutoML またはカスタム モデルを使用した拡張
データセットを準備したら、プロジェクトのニーズに基づいて、次のいずれかの ML 戦略を選択できます。
- AutoML: 迅速な実験と最適化に最適
- カスタム ML: フル コントロールと微調整されたパフォーマンスに最適
AutoML
AutoML では、最適なモデルとハイパーパラメーターを自動的に選択することで ML が簡素化されます。 期待される結果は、AutoML が手動チューニングなしで最高のパフォーマンスのモデルを返すということです。
AutoML を使用するには、次の手順に従います。
- 変換されたデータを AutoML ツールにフィードする ( Azure AutoML や FLAML など)
- 予測ターゲットを定義する (故障確率など)
- AutoML でモデルを最適化する (XGBoost とランダム フォレストの選択など)
AutoML ツールの例を次に示します。
- Azure AutoML (クラウドベース、完全自動化)
- FLAML (Python ベース、軽量)
カスタム機械学習
モデルを完全に制御する必要がある場合は、カスタム モデル アプローチを使用できます。
カスタム モデルを操作するには、次の手順に従います。
- モデル (XGBoost、ランダム フォレスト、ニューラル ネットワークなど) を選択する
- 特徴を手動でエンジニアリングする (ローリング平均や異常検出など)
- 標準 ML ライブラリ (scikit-learn や PyTorch など) を使用してモデルをトレーニングおよび評価する
たとえば、履歴データとオントロジ関係を使用して機器の故障を予測するとします。 ML パイプラインの例には、次の手順が含まれる場合があります。
- オントロジと時系列データをマージする
- ワンホット エンコードカテゴリ機能
- RandomForestClassifier または XGBoost を使用してカスタム モデルをトレーニングする
-
accuracy_score
またはf1_score
を使用してモデルのパフォーマンスを評価する