Share via


Windows 上の AI のサンプル ギャラリー

ローカル API と機械学習 (ML) モデル、DirectML を使用したローカル ハードウェア アクセラレータ、およびクラウドベースの API を使用して Windows アプリを強化するさまざまな方法を示すサンプルのコレクション。

ローカル API と ML モデルを使用して AI で Windows アプリを強化する

これらのサンプルは、ローカル API と機械学習モデルを使用して、AI を使用して Windows アプリを強化するのに役立ちます。

AI 搭載の Audio Editor

AI Audio Trimmer プラグイン をテストする様子を示す Audio Editor のサンプル アプリのスクリーンショット。

GitHub リポジトリ: AI Audio Editor のサンプル

説明: AI 搭載の Audio Editor で、AI を利用して断片的なオーディオを関連するクエリと一致させる WinUI 3 オーディオ編集アプリを構築する様子を示しています。 ユースケースとしては、ソーシャル メディアでの宣伝に使用する、コンテンツの短いオーディオ クリップを作成するポッドキャストのクリエイターが例に挙げられます。 このサンプルでは、ローカル ML モデルの推論を使用して、文字起こしとセマンティック検索を実行しています。

特徴: ONNX Runtime によるローカルモデル推論、Whisper モデル、埋め込みモデル

アプリの種類: C#WinUI 3

AI 搭載のメモ アプリ

AI によって作成された概要を表示する AI 支援型 Notes のサンプル アプリのスクリーンショット。

GitHub リポジトリ: AI 搭載の Notes のサンプル アプリ

説明: この AI 搭載のノート作成アプリケーションは、OCR テキスト認識、ローカル ML モデルによる音声の文字起こし、ローカルな埋め込みモデルを使用したセマンティック検索、Phi-3 でのローカル言語モデルを使用した概要作成、オートコンプリート、テキスト推論、および言語モデルを実データで裏付けるための取得拡張生成 (RAG) などの API を使用する様子を示しています。

特徴: ローカル モデルを使用したセマンティック検索、ローカル モデルを使用した音声の文字起こし、Phi-3 によるローカルでの取得拡張生成 (RAG)、Phi-3 によるローカルでのテキストの要約と推論、OCR API を使用した画像からのテキスト抽出

アプリの種類: C#WinUI 3

PDF および Phi3 を使用した取得検索拡張生成 (RAG)

WPF アプリの RAG PDF アナライザー サンプルのスクリーンショット。

GitHub リポジトリ: RAG PDF Analyzer WPF のサンプル アプリ

説明: この WPF のサンプル アプリは、PDF ドキュメントのコンテンツに関する質問に回答するために、ローカル言語モデル (Phi-3 など) を用いてエクスペリエンスを構築する方法を示しています。 サンプルでは、モデル独自のトレーニング データだけでなく、外部のナレッジ ベースを参照してから回答を生成します。 このパターンは、取得拡張生成 (RAG) と呼ばれ、言語モデルを信頼できる実データで裏付ける方法の一例です。

特徴: 取得拡張生成 (RAG)、ONNX Runtime 生成 AI、DirectML

アプリの種類: C#WPF

Phi3 生成 AI チャット

WinUI 3 アプリで Phi3 を使用する GenAI チャット サンプルのスクリーンショット。

GitHub リポジトリ: WinUI 3 での Phi-3 チャットのサンプル

説明: この WinUI 3 アプリのサンプルは、ONNX Runtime の生成 AI ライブラリを使用し、ローカル言語モデルである Phi-3 小規模言語モデル (SLM) でチャット エクスペリエンスを構築する方法を示しています。

特徴: Phi-3ONNX Runtime 生成 AIDirectML

アプリの種類: C#WinUI 3

Windows スタジオ エフェクトのサンプル

GitHub リポジトリ: Windows スタジオ エフェクトのサンプル アプリ

説明: このコード サンプルでは、Windows アプリケーションからカメラ スタジオ エフェクトを制御する方法を学べます。 サポートされているカメラがシステムで使用できるかどうかを確認し (NPU と組み込みのカメラを搭載したデバイスが必要)、Windows スタジオ エフェクトに関連するカメラの拡張コントロール (背景のぼかし、視線補正、自動フレーミングなど) を取得して設定します。

特徴: Windows スタジオ エフェクト

アプリの種類: C#WPF

DirectML を使用したローカル ハードウェア アクセラレータ

ハードウェア アクセラレーション済みの Web 上の Stable Diffusion

安定拡散 Web アプリのサンプルのスクリーンショット。

GitHub リポジトリ: WebNN Stable Diffusion Turbo

説明: このサンプルは、DirectML を使って Stable Diffusion を GPU 上でローカルに実行する際に、ONNX Runtime Web で WebNN を使用する方法を示しています。 SD-Turbo は、1 つのネットワーク評価のテキスト プロンプトを基に、写真のようにリアルな画像を高速で生成できる Text-to-image モデルです。 デモでは、ニューラル ネットワーク推論のハードウェア アクセラレーション専用の低レベル API である WebNN API を利用して、2 秒で AI PC デバイス上に画像を生成できます。

特徴: ローカル イメージの生成、WebNNDirectML

アプリの種類: JavaScript、Web アプリ

ハードウェア アクセラレーション済みの Web 上の Segment Anything

GitHub リポジトリ: WebNN Segment Anything

説明: このサンプルは、DirectML を使って Segment Anything を GPU 上でローカルに実行する際に、ONNX Runtime Web で WebNN を使用する方法を示しています。 Segment Anything は、任意のオブジェクトの "切り取り" ができる、Meta AI が提供する新しい AI モデルです。 デモでは、アップロードした画像から任意のオブジェクトをセグメント化できます。

特徴: ローカル画像のセグメント化、WebNNDirectML

アプリの種類: JavaScript、Web アプリ

ハードウェア アクセラレーション済みの Web 上の Whisper

GitHub リポジトリ: WebNN Whisper Base

説明: このサンプルは、DirectML を使って Whisper モデルの音声テキスト変換機能を GPU または NPU 上でローカルに実行する際に、ONNX Runtime Web で WebNN を使用する方法を示しています。 Whisper Base は、自動音声認識 (ASR) と音声翻訳を可能にする事前トレーニング済みのモデルです。 デモでは、WebNN API と DirectML (特に NPU アクセラレーション) によって提供されるデバイス上の推論を使用して、音声テキスト変換機能を体験できます。

特徴: ローカル音声テキスト変換、WebNNDirectML

アプリの種類: JavaScript、Web アプリ

DirectML を使用したハードウェア アクセラレータと事前最適化された ONNX ランタイム言語モデル (Phi3、Llama3 など)

DirectML LLM チャット UI ONNX モデルサンプルのスクリーンショット。

GitHub リポジトリ: Olive リポジトリの DirectML の例

説明: このサンプルでは、事前に最適化された ONNX ランタイム (ORT) 言語モデルを、DirectML を使用して GPU 上でローカルに実行する方法を示します。 このサンプルには、環境を設定する方法、ORT Generate API を使用して事前トレーニング済みの最新の言語モデルをダウンロードする方法、Gradio アプリでモデルを実行する方法に関する手順が含まれています。

機能: ハードウェア アクセラレータ、GenAI、ONNXONNX ランタイムDirectML

アプリの種類: Python、Gradio

DirectML を使用したハードウェア アクセラレータ PyTorch モデル (Phi3、Llama3 など)

DirectML PyTorch サンプルのスクリーンショット。

GitHub リポジトリ: DirectML PyTorch のサンプル

説明: このサンプルは、DirectML を使用して、GPU 上で PyTorch 言語モデルをローカルで実行する方法を示しています。 このサンプルには、環境を設定する方法、事前トレーニング済みの最新の言語モデルをダウンロードする方法、Gradio アプリでモデルを実行する方法に関する手順が含まれています。 このサンプルでは、Llama モデル、Phi3-mini、Phi2、Mistral-7B など、さまざまなオープン ソース言語モデルをサポートしています。

機能: ハードウェア アクセラレータ、PyTorchDirectML

アプリの種類: Python、Gradio

クラウド API を使用して Windows アプリを AI で強化

その他のクラウドベースの API サンプルについては、「Azure AI サービスのドキュメント」を参照してください。

OpenAI チャット入力候補を WinUI 3/Windows アプリ SDK アプリに追加する

チュートリアル: OpenAI のチャット補完機能を WinUI 3/Windows アプリ SDK アプリに追加する

説明: OpenAI のチャット補完機能を WinUI 3/Windows アプリ SDK デスクトップ アプリに統合します。

特徴: OpenAI のチャット補完機能

アプリの種類: C#WinUI 3

DALL-E を WinUI 3/Windows App SDK デスクトップ アプリに追加する

チュートリアル: DALL·E を WinUI 3/Windows アプリ SDK デスクトップ アプリに追加する

説明: OpenAI DALL·E の画像生成機能を WinUI 3/Windows アプリ SDK デスクトップ アプリに統合します。

特徴: 画像生成

アプリの種類: C#WinUI 3

.NET MAUI と ChatGPT を使用して推奨アプリを作成する

チュートリアル: .NET MAUI と ChatGPT を使用して推奨アプリを作成する

説明: OpenAI のチャット補完機能を .NET MAUI デスクトップ アプリに統合します。

特徴: 画像生成

アプリの種類: C#.NET MAUI

.NET MAUI Windows デスクトップ アプリに DALL-E を追加する

チュートリアル: .NET MAUI Windows デスクトップ アプリに DALL·E を追加する

説明: OpenAI の DALL·E 画像生成機能を .NET MAUI デスクトップ アプリに統合します。

特徴: 画像生成

アプリの種類: C#.NET MAUI

レガシの WinML サンプル

GitHub リポジトリ: GitHub 上の WinML のサンプル

説明: WinML は引き続きサポートされますが、これらのサンプルは更新されておらず、最新の AI 活用事例が反映されていません。