次の方法で共有


Windows AI APIsとは

さまざまな Windows AI FoundryAPIsのアイコンを示す画像。

Windows AI Foundry は、Windows 機械学習 (ML) を通じて有効にされた一連の Windows AI APIs とハードウェア抽象化 AI 推論機能を通じて、さまざまな人工知能 (AI) 機能を提供します。 Windows AI APIs 、独自の機械学習 (ML) モデルを検索、実行、または最適化することなく、AI 機能を有効にします。 Copilot+ PC の Windows AI Foundry に電力を供給するモデルは、バックグラウンドでローカルおよび継続的に実行されます。

WinUI でAPIを使用する方法を示す完全なアプリについては、を参照してください。

初めての AI 搭載 Windows アプリを構築する

Visual Studio といくつかの単純な Windows AI APIsを使用して初めての Windows アプリをビルドするには、前提条件を満たし、「Windows AI APIsを使用したアプリの構築を開始する」で提供されているサンプル コードを使用します。

そこから、APIs、Imaging walthroughOCR walthrough などの特定の Windows AI を利用してアプリを構築する短いチュートリアルに進むことができます。

PC で APIs とモデルを試す

AI Dev Gallery は、Microsoft Store から入手できるデモ アプリで、Windows AI APIs とモデルをすばやくダウンロード、試用、使用できます。

AI Dev Galleryで、Windows AI APIs タブ メニュー項目を選択し、Phi Silica サンプルを選択します。 モデルが既にデバイスで使用できる場合、そのサンプルはすぐに実行されます。 それ以外の場合は、[ モデルの要求 ] を選択してモデルをダウンロードします。 ダウンロードすると、そのサンプルがアクティブになります。 AI Dev Galleryの詳細については、「AI Dev Galleryとは」を参照してください。

使用可能な機能の概要 APIs

Windows アプリから利用できるすぐに使用できる AI 機能をいくつか次に示します。

Phi Silica

ChatGPT を強化する OpenAI の GPT Large Language Model (LLM) と同様に、Phi はローカル デバイスで言語処理タスクを実行するために Microsoft Research によって開発された小さな言語モデル (SLM) です。 Phi Silica は、ニューラル処理ユニット (NPU) を持つ Windows デバイス向けに特別に設計されており、テキスト生成機能と会話機能を、デバイス上で直接高パフォーマンスのハードウェアアクセラレータで実行できます。 Phi Silica は中国では使用できません。

AI チャット プロンプトの読み取りを示すアニメーション GIF では、自分を紹介し、Phi Silica 機能を使用して応答が生成されます。

「Phi Silica の使用を開始する」も参照してください。

ヒント

アクセシビリティと読みやすさを向上させるために、このページでは既定のビューで静止画像を使用します。 画像をクリックすると、アニメーション化されたバージョンを表示できます。

テキスト認識

テキスト認識 APIs 、画像内のテキストの認識と、さまざまな種類のドキュメント (スキャンされた紙のドキュメント、PDF ファイル、デジタル カメラでキャプチャされた画像など) のローカル デバイス上で編集可能で検索可能なデータへの変換を可能にします。

テキスト認識機能を使用してファイルまたはクリップボードにコピーできるテキスト オーバーレイで認識されているスクリーンショット内の単語を示すアニメーション GIF。

AIテキスト認識の利用開始ガイドも参照してください

画像の超解像度

イメージのスーパー解像度 APIs イメージのシャープニングとスケーリングを有効にします。

画像のスーパー解像度機能を使用してシャープ化およびスケーリングされている単語と画像が混在する画像を示すアニメーション GIF。

また、「 画像の超解像度でできること」も参照してください。

画像のセグメント化

画像のセグメント化 APIs 画像のセグメント化を有効にします。

男性が地面から 1 フィート離れた後、[背景の削除] を選択して、画像セグメント化機能を使用して、白い背景に男性の画像を分離することを示すアニメーション GIF。

また、「 画像のセグメント化でできること」も参照してください。

イメージの説明

画像の説明 APIs では、自然言語での画像について説明します。 イメージの説明機能は、中国では使用できません。

自然言語を使って、眠っている犬のアニメーションGIFがポップアップで表示されます。その犬はふわふわで長い毛の犬がソファで快適に横たわっている様子です。画像の説明機能を使用しています。

画像からテキストの説明を取得する方法も参照してください

オブジェクトの消去

オブジェクト消去 APIs では、イメージからオブジェクトを削除できます。

ユーザーがオブジェクト消去機能を使用してオブジェクトを削除している画像を示すアニメーション GIF。

「オブジェクト消去を始める方法」も参照してください

その他の AI 機能

  • Windows Studio Effects。 互換性のあるニューラル処理ユニット (NPU) を持つ Windows デバイスは、 Windows Studio Effects をデバイスの組み込みのカメラとマイクの設定に統合します。 背景ぼかし、アイコンタクト補正、自動フレーミング、縦ライト補正、クリエイティブ フィルター、音声フォーカスなど、AI を使用する特殊効果を適用して背景ノイズを除外できます。 「 Windows Studio Effects の概要 (プレビュー)」を参照してください。

  • Recall: Recall を使用すると、ユーザーはドキュメント、画像、Web サイトなど、過去のアクティビティからすばやく見つけることができます。 開発者は、Recallすることで、アプリでユーザーのエクスペリエンスを強化できます。 この統合により、ユーザーはアプリを中断したところから再開できるようになり、アプリのエンゲージメントと、Windows とアプリ間のシームレスな移動が向上します。 Recall概要を参照してください。

  • ライブ キャプション翻訳 (まだサポートされていません)。 (オーディオ コンテンツがシステムの優先言語とは異なる言語である場合でも) 音声コンテンツのキャプションを表示することで、聴覚障碍のあるユーザーを含め、Windows を使用するすべてのユーザーが音声をよりよく理解できるようにします。

コンテンツ モデレーション

コンテンツ Windows AI Foundry を管理する方法と、感度フィルターを調整する方法について説明します。 Windows AI Foundryを使用したコンテンツの安全性モデレーションに関するページを参照してください。

AI 機能を利用する場合は、「Windowsでの責任ある生成 AI アプリケーションと機能の開発」を確認することをお勧めします。

その他の技術情報

こちらも参照ください