Windows AI Foundry は、Windows 機械学習 (ML) を通じて有効にされた一連の Windows AI APIs とハードウェア抽象化 AI 推論機能を通じて、さまざまな人工知能 (AI) 機能を提供します。 Windows AI APIs 、独自の機械学習 (ML) モデルを検索、実行、または最適化することなく、AI 機能を有効にします。 Copilot+ PC の Windows AI Foundry に電力を供給するモデルは、バックグラウンドでローカルおよび継続的に実行されます。
WinUI でAPIを使用する方法を示す完全なアプリについては、を参照してください。
初めての AI 搭載 Windows アプリを構築する
Visual Studio といくつかの単純な Windows AI APIsを使用して初めての Windows アプリをビルドするには、前提条件を満たし、「Windows AI APIsを使用したアプリの構築を開始する」で提供されているサンプル コードを使用します。
そこから、APIs、Imaging walthrough、OCR walthrough などの特定の Windows AI を利用してアプリを構築する短いチュートリアルに進むことができます。
PC で APIs とモデルを試す
AI Dev Gallery は、Microsoft Store から入手できるデモ アプリで、Windows AI APIs とモデルをすばやくダウンロード、試用、使用できます。
AI Dev Galleryで、Windows AI APIs タブ メニュー項目を選択し、Phi Silica サンプルを選択します。 モデルが既にデバイスで使用できる場合、そのサンプルはすぐに実行されます。 それ以外の場合は、[ モデルの要求 ] を選択してモデルをダウンロードします。 ダウンロードすると、そのサンプルがアクティブになります。 AI Dev Galleryの詳細については、「AI Dev Galleryとは」を参照してください。
使用可能な機能の概要 APIs
Windows アプリから利用できるすぐに使用できる AI 機能をいくつか次に示します。
- Phi Silica。 ローカルのすぐに使用できる言語モデル。 「Phi Silica の使用を開始する」を参照してください。
- AI テキスト認識。 画像内のテキストを認識し、画像/pdf を検索可能なテキストに変換します。 AI テキスト認識の始め方を参照してください。
- AI イメージング。 AI (画像のスーパー解像度) を使用して画像をスケーリングおよびシャープにし、画像内のオブジェクトを識別します (画像のセグメント化)。 AI イメージングの概要を参照してください。
- Windows Studio Effects。 デバイスの組み込みのカメラとマイクに AI 効果を適用します。 「 Windows Studio Effects の概要 (プレビュー)」を参照してください。
Phi Silica
ChatGPT を強化する OpenAI の GPT Large Language Model (LLM) と同様に、Phi はローカル デバイスで言語処理タスクを実行するために Microsoft Research によって開発された小さな言語モデル (SLM) です。 Phi Silica は、ニューラル処理ユニット (NPU) を持つ Windows デバイス向けに特別に設計されており、テキスト生成機能と会話機能を、デバイス上で直接高パフォーマンスのハードウェアアクセラレータで実行できます。 Phi Silica は中国では使用できません。
「Phi Silica の使用を開始する」も参照してください。
ヒント
アクセシビリティと読みやすさを向上させるために、このページでは既定のビューで静止画像を使用します。 画像をクリックすると、アニメーション化されたバージョンを表示できます。
テキスト認識
テキスト認識 APIs 、画像内のテキストの認識と、さまざまな種類のドキュメント (スキャンされた紙のドキュメント、PDF ファイル、デジタル カメラでキャプチャされた画像など) のローカル デバイス上で編集可能で検索可能なデータへの変換を可能にします。
AIテキスト認識の利用開始ガイドも参照してください
画像の超解像度
イメージのスーパー解像度 APIs イメージのシャープニングとスケーリングを有効にします。
また、「 画像の超解像度でできること」も参照してください。
画像のセグメント化
画像のセグメント化 APIs 画像のセグメント化を有効にします。
また、「 画像のセグメント化でできること」も参照してください。
イメージの説明
画像の説明 APIs では、自然言語での画像について説明します。 イメージの説明機能は、中国では使用できません。
画像からテキストの説明を取得する方法も参照してください
オブジェクトの消去
オブジェクト消去 APIs では、イメージからオブジェクトを削除できます。
「オブジェクト消去を始める方法」も参照してください
その他の AI 機能
Windows Studio Effects。 互換性のあるニューラル処理ユニット (NPU) を持つ Windows デバイスは、 Windows Studio Effects をデバイスの組み込みのカメラとマイクの設定に統合します。 背景ぼかし、アイコンタクト補正、自動フレーミング、縦ライト補正、クリエイティブ フィルター、音声フォーカスなど、AI を使用する特殊効果を適用して背景ノイズを除外できます。 「 Windows Studio Effects の概要 (プレビュー)」を参照してください。
Recall: Recall を使用すると、ユーザーはドキュメント、画像、Web サイトなど、過去のアクティビティからすばやく見つけることができます。 開発者は、Recallすることで、アプリでユーザーのエクスペリエンスを強化できます。 この統合により、ユーザーはアプリを中断したところから再開できるようになり、アプリのエンゲージメントと、Windows とアプリ間のシームレスな移動が向上します。 Recall概要を参照してください。
ライブ キャプション翻訳 (まだサポートされていません)。 (オーディオ コンテンツがシステムの優先言語とは異なる言語である場合でも) 音声コンテンツのキャプションを表示することで、聴覚障碍のあるユーザーを含め、Windows を使用するすべてのユーザーが音声をよりよく理解できるようにします。
コンテンツ モデレーション
コンテンツ Windows AI Foundry を管理する方法と、感度フィルターを調整する方法について説明します。 Windows AI Foundryを使用したコンテンツの安全性モデレーションに関するページを参照してください。
AI 機能を利用する場合は、「Windowsでの責任ある生成 AI アプリケーションと機能の開発」を確認することをお勧めします。
その他の技術情報
- コード サンプルとチュートリアル。 AI を使用して Windows アプリを強化するさまざまな方法を示すサンプルのコレクション。
- Windows AI Foundry APIsを使用してエンタープライズ アプリに AI を統合します。 2024 年 11 月の Microsoft Ignite カンファレンスのデモ セッションをご覧ください。
- Windows App SDK GitHub リポジトリに新しいイシューを作成するか、APIsに対応することで、これらのとその機能に関するフィードバックを提供します。