Windows 上の AI のサンプルギャラリー

[アーティクル]
2024/05/21

ローカル API と機械学習 (ML) モデル、DirectML を使用したローカルハードウェアアクセラレータ、およびクラウドベースの API を使用して Windows アプリを強化するさまざまな方法を示すサンプルのコレクション。

ローカル API と ML モデルを使用して AI で Windows アプリを強化する

これらのサンプルは、ローカル API と機械学習モデルを使用して、AI を使用して Windows アプリを強化するのに役立ちます。

AI 搭載の Audio Editor

AI Audio Trimmer プラグインをテストする様子を示す Audio Editor のサンプルアプリのスクリーンショット。

説明: AI 搭載の Audio Editor で、AI を利用して断片的なオーディオを関連するクエリと一致させる WinUI 3 オーディオ編集アプリを構築する様子を示しています。ユースケースとしては、ソーシャルメディアでの宣伝に使用する、コンテンツの短いオーディオクリップを作成するポッドキャストのクリエイターが例に挙げられます。このサンプルでは、ローカル ML モデルの推論を使用して、文字起こしとセマンティック検索を実行しています。

特徴: ONNX Runtime によるローカルモデル推論、Whisper モデル、埋め込みモデル

アプリの種類: C#、WinUI 3

AI 搭載のメモアプリ

AI によって作成された概要を表示する AI 支援型 Notes のサンプルアプリのスクリーンショット。

GitHub リポジトリ: AI 搭載の Notes のサンプルアプリ

説明: この AI 搭載のノート作成アプリケーションは、OCR テキスト認識、ローカル ML モデルによる音声の文字起こし、ローカルな埋め込みモデルを使用したセマンティック検索、Phi-3 でのローカル言語モデルを使用した概要作成、オートコンプリート、テキスト推論、および言語モデルを実データで裏付けるための取得拡張生成 (RAG) などの API を使用する様子を示しています。

特徴: ローカルモデルを使用したセマンティック検索、ローカルモデルを使用した音声の文字起こし、Phi-3 によるローカルでの取得拡張生成 (RAG)、Phi-3 によるローカルでのテキストの要約と推論、OCR API を使用した画像からのテキスト抽出

アプリの種類: C#、WinUI 3

PDF および Phi3 を使用した取得検索拡張生成 (RAG)

WPF アプリの RAG PDF アナライザーサンプルのスクリーンショット。

GitHub リポジトリ: RAG PDF Analyzer WPF のサンプルアプリ

説明: この WPF のサンプルアプリは、PDF ドキュメントのコンテンツに関する質問に回答するために、ローカル言語モデル (Phi-3 など) を用いてエクスペリエンスを構築する方法を示しています。サンプルでは、モデル独自のトレーニングデータだけでなく、外部のナレッジベースを参照してから回答を生成します。このパターンは、取得拡張生成 (RAG) と呼ばれ、言語モデルを信頼できる実データで裏付ける方法の一例です。

特徴: 取得拡張生成 (RAG)、ONNX Runtime 生成 AI、DirectML

アプリの種類: C#、WPF

Phi3 生成 AI チャット

WinUI 3 アプリで Phi3 を使用する GenAI チャットサンプルのスクリーンショット。

GitHub リポジトリ: WinUI 3 での Phi-3 チャットのサンプル

説明: この WinUI 3 アプリのサンプルは、ONNX Runtime の生成 AI ライブラリを使用し、ローカル言語モデルである Phi-3 小規模言語モデル (SLM) でチャットエクスペリエンスを構築する方法を示しています。

特徴: Phi-3、ONNX Runtime 生成 AI、DirectML

アプリの種類: C#、WinUI 3

Windows スタジオエフェクトのサンプル

GitHub リポジトリ: Windows スタジオエフェクトのサンプルアプリ

説明: このコードサンプルでは、Windows アプリケーションからカメラスタジオエフェクトを制御する方法を学べます。サポートされているカメラがシステムで使用できるかどうかを確認し (NPU と組み込みのカメラを搭載したデバイスが必要)、Windows スタジオエフェクトに関連するカメラの拡張コントロール (背景のぼかし、視線補正、自動フレーミングなど) を取得して設定します。

特徴: Windows スタジオエフェクト

アプリの種類: C#、WPF

DirectML を使用したローカルハードウェアアクセラレータ

ハードウェアアクセラレーション済みの Web 上の Stable Diffusion

安定拡散 Web アプリのサンプルのスクリーンショット。

GitHub リポジトリ: WebNN Stable Diffusion Turbo

説明: このサンプルは、DirectML を使って Stable Diffusion を GPU 上でローカルに実行する際に、ONNX Runtime Web で WebNN を使用する方法を示しています。 SD-Turbo は、1 つのネットワーク評価のテキストプロンプトを基に、写真のようにリアルな画像を高速で生成できる Text-to-image モデルです。デモでは、ニューラルネットワーク推論のハードウェアアクセラレーション専用の低レベル API である WebNN API を利用して、2 秒で AI PC デバイス上に画像を生成できます。

特徴: ローカルイメージの生成、WebNN、DirectML

アプリの種類: JavaScript、Web アプリ

ハードウェアアクセラレーション済みの Web 上の Segment Anything

GitHub リポジトリ: WebNN Segment Anything

説明: このサンプルは、DirectML を使って Segment Anything を GPU 上でローカルに実行する際に、ONNX Runtime Web で WebNN を使用する方法を示しています。 Segment Anything は、任意のオブジェクトの "切り取り" ができる、Meta AI が提供する新しい AI モデルです。デモでは、アップロードした画像から任意のオブジェクトをセグメント化できます。

特徴: ローカル画像のセグメント化、WebNN、DirectML

アプリの種類: JavaScript、Web アプリ

ハードウェアアクセラレーション済みの Web 上の Whisper

GitHub リポジトリ: WebNN Whisper Base

説明: このサンプルは、DirectML を使って Whisper モデルの音声テキスト変換機能を GPU または NPU 上でローカルに実行する際に、ONNX Runtime Web で WebNN を使用する方法を示しています。 Whisper Base は、自動音声認識 (ASR) と音声翻訳を可能にする事前トレーニング済みのモデルです。デモでは、WebNN API と DirectML (特に NPU アクセラレーション) によって提供されるデバイス上の推論を使用して、音声テキスト変換機能を体験できます。

特徴: ローカル音声テキスト変換、WebNN、DirectML

アプリの種類: JavaScript、Web アプリ

DirectML を使用したハードウェアアクセラレータと事前最適化された ONNX ランタイム言語モデル (Phi3、Llama3 など)

DirectML LLM チャット UI ONNX モデルサンプルのスクリーンショット。

GitHub リポジトリ: Olive リポジトリの DirectML の例

説明: このサンプルでは、事前に最適化された ONNX ランタイム (ORT) 言語モデルを、DirectML を使用して GPU 上でローカルに実行する方法を示します。このサンプルには、環境を設定する方法、ORT Generate API を使用して事前トレーニング済みの最新の言語モデルをダウンロードする方法、Gradio アプリでモデルを実行する方法に関する手順が含まれています。

機能: ハードウェアアクセラレータ、GenAI、ONNX、ONNX ランタイム、DirectML

アプリの種類: Python、Gradio

DirectML を使用したハードウェアアクセラレータ PyTorch モデル (Phi3、Llama3 など)

DirectML PyTorch サンプルのスクリーンショット。

GitHub リポジトリ: DirectML PyTorch のサンプル

説明: このサンプルは、DirectML を使用して、GPU 上で PyTorch 言語モデルをローカルで実行する方法を示しています。このサンプルには、環境を設定する方法、事前トレーニング済みの最新の言語モデルをダウンロードする方法、Gradio アプリでモデルを実行する方法に関する手順が含まれています。このサンプルでは、Llama モデル、Phi3-mini、Phi2、Mistral-7B など、さまざまなオープンソース言語モデルをサポートしています。

機能: ハードウェアアクセラレータ、PyTorch、DirectML

アプリの種類: Python、Gradio

クラウド API を使用して Windows アプリを AI で強化

その他のクラウドベースの API サンプルについては、「Azure AI サービスのドキュメント」を参照してください。

OpenAI チャット入力候補を WinUI 3/Windows アプリ SDK アプリに追加する

チュートリアル: OpenAI のチャット補完機能を WinUI 3/Windows アプリ SDK アプリに追加する

説明: OpenAI のチャット補完機能を WinUI 3/Windows アプリ SDK デスクトップアプリに統合します。

特徴: OpenAI のチャット補完機能

アプリの種類: C#、WinUI 3

DALL-E を WinUI 3/Windows App SDK デスクトップアプリに追加する

チュートリアル: DALL·E を WinUI 3/Windows アプリ SDK デスクトップアプリに追加する

説明: OpenAI DALL·E の画像生成機能を WinUI 3/Windows アプリ SDK デスクトップアプリに統合します。

特徴: 画像生成

アプリの種類: C#、WinUI 3

.NET MAUI と ChatGPT を使用して推奨アプリを作成する

チュートリアル: .NET MAUI と ChatGPT を使用して推奨アプリを作成する

説明: OpenAI のチャット補完機能を .NET MAUI デスクトップアプリに統合します。

特徴: 画像生成

アプリの種類: C#、.NET MAUI

.NET MAUI Windows デスクトップアプリに DALL-E を追加する

チュートリアル: .NET MAUI Windows デスクトップアプリに DALL·E を追加する

説明: OpenAI の DALL·E 画像生成機能を .NET MAUI デスクトップアプリに統合します。

特徴: 画像生成

アプリの種類: C#、.NET MAUI

レガシの WinML サンプル

GitHub リポジトリ: GitHub 上の WinML のサンプル

説明: WinML は引き続きサポートされますが、これらのサンプルは更新されておらず、最新の AI 活用事例が反映されていません。

次の方法で共有

Windows 上の AI のサンプルギャラリー

ローカル API と ML モデルを使用して AI で Windows アプリを強化する

AI 搭載の Audio Editor

AI 搭載のメモアプリ

PDF および Phi3 を使用した取得検索拡張生成 (RAG)

Phi3 生成 AI チャット

Windows スタジオエフェクトのサンプル

DirectML を使用したローカルハードウェアアクセラレータ

ハードウェアアクセラレーション済みの Web 上の Stable Diffusion

ハードウェアアクセラレーション済みの Web 上の Segment Anything

ハードウェアアクセラレーション済みの Web 上の Whisper

DirectML を使用したハードウェアアクセラレータと事前最適化された ONNX ランタイム言語モデル (Phi3、Llama3 など)

DirectML を使用したハードウェアアクセラレータ PyTorch モデル (Phi3、Llama3 など)

クラウド API を使用して Windows アプリを AI で強化

OpenAI チャット入力候補を WinUI 3/Windows アプリ SDK アプリに追加する

DALL-E を WinUI 3/Windows App SDK デスクトップアプリに追加する

.NET MAUI と ChatGPT を使用して推奨アプリを作成する

.NET MAUI Windows デスクトップアプリに DALL-E を追加する

レガシの WinML サンプル

フィードバック

その他のリソース

次の方法で共有

Windows 上の AI のサンプル ギャラリー

ローカル API と ML モデルを使用して AI で Windows アプリを強化する

AI 搭載の Audio Editor

AI 搭載のメモ アプリ

PDF および Phi3 を使用した取得検索拡張生成 (RAG)

Phi3 生成 AI チャット

Windows スタジオ エフェクトのサンプル

DirectML を使用したローカル ハードウェア アクセラレータ

ハードウェア アクセラレーション済みの Web 上の Stable Diffusion

ハードウェア アクセラレーション済みの Web 上の Segment Anything

ハードウェア アクセラレーション済みの Web 上の Whisper

DirectML を使用したハードウェア アクセラレータと事前最適化された ONNX ランタイム言語モデル (Phi3、Llama3 など)

DirectML を使用したハードウェア アクセラレータ PyTorch モデル (Phi3、Llama3 など)

クラウド API を使用して Windows アプリを AI で強化

OpenAI チャット入力候補を WinUI 3/Windows アプリ SDK アプリに追加する

DALL-E を WinUI 3/Windows App SDK デスクトップ アプリに追加する

.NET MAUI と ChatGPT を使用して推奨アプリを作成する

.NET MAUI Windows デスクトップ アプリに DALL-E を追加する

レガシの WinML サンプル

フィードバック

その他のリソース

Windows 上の AI のサンプルギャラリー

AI 搭載のメモアプリ

Windows スタジオエフェクトのサンプル

DirectML を使用したローカルハードウェアアクセラレータ

ハードウェアアクセラレーション済みの Web 上の Stable Diffusion

ハードウェアアクセラレーション済みの Web 上の Segment Anything

ハードウェアアクセラレーション済みの Web 上の Whisper

DirectML を使用したハードウェアアクセラレータと事前最適化された ONNX ランタイム言語モデル (Phi3、Llama3 など)

DirectML を使用したハードウェアアクセラレータ PyTorch モデル (Phi3、Llama3 など)

DALL-E を WinUI 3/Windows App SDK デスクトップアプリに追加する

.NET MAUI Windows デスクトップアプリに DALL-E を追加する