Windows AI APIs란?

다양한 Windows AI APIs의 아이콘을 보여 주는 이미지.

Windows AI Foundry는 Windows AI APIs 및 Windows ML(기계 학습)을 통해 사용하도록 설정된 하드웨어 추상화된 AI 추론 기능을 통해 다양한 AI(인공 지능) 기능을 제공합니다. Windows AI APIs 를 사용하면 자체 ML(기계 학습) 모델을 찾거나 실행하거나 최적화할 필요 없이 AI 기능을 사용할 수 있습니다. WINDOWS AI Foundry에 전원을 공급하는 모델은 NPU를 사용하는 Copilot+ PCs, 지원되는 GPU가 있는 디바이스 및 권장 CPU 사양을 충족하는 디바이스를 포함하여 지원되는 Windows 11 디바이스에서 로컬로 실행되며 백그라운드에서 계속 실행할 수 있습니다.

지원되는 하드웨어

Windows AI APIs 광범위한 하드웨어를 지원하기 위해 Copilot+ PCs 이상으로 확장되고 있습니다. 다음 표에서는 각각 API에 대한 현재 하드웨어 지원을 보여줍니다.

비고

Copilot+ PC에서는 지원되는 APIs가 항상 NPU에서 실행됩니다. GPUCPU 열은 비 Copilot+ 디바이스로의 확장을 설명합니다. 이 열은 Copilot+ PC 옵트인할 수 있는 대체 백 엔드가 아닙니다.

API NPU(Copilot+ PC) GPU (그래픽 처리 장치) CPU
피 실리카 ✅ 사용 가능 ✅ 사용 가능(GPU 선택) ❌ 지원되지 않음
텍스트 인식(OCR) ✅ 사용 가능 ❌ 지원되지 않음 ❌ 지원되지 않음
음성 인식 ✅ 사용 가능 ❌ 지원되지 않음 ✅ 사용 가능(선택 사항, 이동식)
비디오 슈퍼 해상도 ✅ 사용 가능 ❌ 지원되지 않음 ✅ 사용 가능
이미지 슈퍼 해상도 ✅ 사용 가능 ❌ 지원되지 않음 ❌ 지원되지 않음
이미지 설명 ✅ 사용 가능 ❌ 지원되지 않음 ❌ 지원되지 않음
이미지 구분 ✅ 사용 가능 ❌ 지원되지 않음 ❌ 지원되지 않음
개체 지우기 ✅ 사용 가능 ❌ 지원되지 않음 ❌ 지원되지 않음
이미지 생성 ✅ 사용 가능(선택 사항, 이동식) ❌ 지원되지 않음 ❌ 지원되지 않음

비고

Phi Silica에 대한 GPU 지원은 현재 NVIDIA GPU(RTX 30 시리즈 이상 및 6GB vRAM 이상)에서 사용할 수 있습니다. AMD GPU 지원은 곧 제공될 예정입니다. GPU 유추를 사용하려면 개발자 모드(개발자를 위한>>) 및 제조업체에서 직접 설치한 최신 GPU 드라이버가 필요합니다(Phi Silica - GPU 드라이버 요구 사항 참조). 비디오 슈퍼 해상도 및 음성 인식은 모든 CPU에서 실행되지만 권장 사양 을 충족하는 디바이스에서 가장 잘 수행됩니다(물리적 코어 4개, 기본 클록 3GHz 이상, L3 캐시 32MB 이상). 자세한 내용 및 런타임 확인은 개별 API 페이지를 참조하세요.

모델 가용성

기본 AI 모델이 디바이스에 도달하는 방법은 다음에 따라 달라집니다 API.

  • Phi Silica — Copilot+ PC에서는 이 모델이 NPU에 사전 설치되어 있습니다. GPU 및 CPU 디바이스에서 모델은 미리 설치 되지 않습니다 . 앱이 처음 호출 EnsureReadyAsync될 때 요청 시 다운로드됩니다. 다운로드는 몇 GB일 수 있으며 Windows 업데이트 통해 백그라운드에서 실행할 수 있습니다. 최종 사용자는 설정>시스템>AI 구성 요소에서 모델을 제거하거나 다시 설치할 수 있습니다. 앱은 다운로드를 트리거하기 전에 먼저 확인하고 GetReadyState 동의 대화 상자를 표시해야 합니다. 권장되는 UX 패턴은 Phi Silica - 모델 가용성 및 다운로드 를 참조하세요.
  • AI 이미지 생성 - NPU에서만 실행되지만 설치 크기 때문에 모델이 미리 설치되지 않습니다 . 앱이 처음 호출 EnsureReadyAsync될 때 요청 시 다운로드되며 사용자는 나중에 설정>시스템>AI 구성 요소에서 제거할 수 있습니다. 앱은 다운로드를 트리거하기 전에 먼저 확인하고 GetReadyState 동의 대화 상자를 표시해야 합니다. 권장되는 UX 패턴은 AI 이미지 생성 — 모델 가용성 및 다운로드를 참조하세요.
  • 비디오 초해상도 — VSR 모델은 지원되는 모든 하드웨어 경로에서 Windows 앱 SDK와 함께 제공됩니다. 첫 실행 다운로드, 동의 단계 또는 이동식 모델이 없습니다. 비디오 슈퍼 해상도를 참조하세요. 권장 CPU 사양입니다.
  • 음성 인식 — Copilot+ PC에서는 해당 모델이 NPU에 사전 설치되어 있습니다. CPU 전용 디바이스에서 모델은 미리 설치 되지 않습니다 . 앱이 처음 호출 EnsureReadyAsync될 때 요청 시 다운로드되며 사용자는 나중에 설정>시스템>AI 구성 요소에서 해당 모델을 제거할 수 있습니다. 앱은 먼저 GetReadyState를 확인하고 CPU에서 다운로드를 시작하기 전에 동의 대화상자를 표시해야 합니다. 음성 인식 - 권장되는 UX 패턴에 대한 모델 가용성 및 다운로드 를 참조하세요.

WinUI와 함께 사용하는 방법은 WinUI 샘플 앱이 포함된 Windows AI APIs 를 참조하세요.Microsoft Foundry on Windows

중요합니다

다음은 현재 지원되는 Windows AI 기능 및 Windows 앱 SDK 릴리스 목록입니다. 간략한 설명은 이 항목의 뒷부분에서 사용할 수 있는 APIs개요를 참조하세요.

[버전 2.2.2-experimental9 (2026년 6월 실험 버전)] - GPU의 Phi Silica (Windows Insider 실험 채널 빌드 필요)

버전 1.8.0(1.8.250907003) - Phi Silica(제한된 액세스 기능), 대화 요약(텍스트 인텔리전스), 개체 지우기

버전 1.8 미리 보기(1.8.0-preview) - Phi Silica에 대한 LoRA 미세 조정, 텍스트 재작성기 톤(텍스트 인텔리전스)

프라이빗 미리 보기 - 의미 체계 검색

버전 1.7.1(1.7.250401001) - 기타 APIs

첫 번째 AI 기반 Windows 앱 빌드

팁 (조언)

접근성과 가독성을 향상시키기 위해 이 페이지에는 기본적으로 스틸 이미지가 표시됩니다. 경우에 따라 이미지를 클릭하여 애니메이션 버전을 볼 수 있습니다.

Visual Studio 및 일부 간단한 Windows AIAPIs를 사용하여 첫 번째 Windows 앱을 빌드하려면 필수 구성 요소를 충족하고 Windows AIAPIs를 사용하여 앱 빌드를 시작할 때 제공된 예제 코드를 사용하세요.

여기에서 APIs, Imaging walthroughOCR walthrough와 같은 특정 Windows AI 를 활용하는 앱을 빌드하는 짧은 자습서로 이동할 수 있습니다.

PC에서 APIs와 모델을 사용해 보기.

AI Dev Gallery 은 Microsoft Store에서 사용할 수 있는 데모 앱으로, Windows AI APIs 및 모델을 빠르게 다운로드, 사용해 보기 및 사용할 수 있습니다.

에서 AI Dev GalleryWindows AI APIs 탭 메뉴 항목을 선택한 다음, Phi Silica 샘플을 선택합니다. 디바이스에서 모델을 이미 사용할 수 있는 경우 해당 샘플이 바로 실행됩니다. 그렇지 않은 경우 모델 요청을 선택하여 모델을 다운로드합니다. 다운로드되면 해당 샘플이 활성화됩니다. AI Dev Gallery의 AI Dev Gallery에 대해 자세히 알아보세요.

사용 가능한 항목의 개요 APIs

다음은 Windows 앱에서 활용할 수 있는 몇 가지 즉시 사용할 수 있는 AI 기능입니다.

피 실리카

LLM(큰 언어 모델)과 마찬가지로 Phi Silica는 로컬 디바이스에서 언어 처리 작업을 수행하기 위해 Microsoft Research에서 개발한 SLM(Small Language Model)입니다(Get started with Phi Silica 참조). Phi Silica는 NPU(신경 처리 장치) 또는 지원되는 GPU가 있는 Windows 디바이스용으로 설계되어 텍스트 생성 및 대화 기능을 디바이스에서 직접 고성능 하드웨어 가속 방식으로 실행할 수 있습니다. 피 실리카는 중국에서 사용할 수 없습니다.

AI 채팅 프롬프트 읽기를 보여주는 애니메이션 GIF는 자신을 소개하고 Phi Silica 기능을 사용하여 응답을 생성합니다.

텍스트 인식

텍스트 인식을 APIs 사용하면 이미지의 텍스트를 인식할 수 있으며, 다양한 유형의 문서(예: 스캔한 종이 문서, PDF 파일 및 디지털 카메라에서 캡처한 이미지)의 로컬 디바이스에서 편집 가능하고 검색 가능한 데이터로 변환할 수 있습니다( AI 텍스트 인식 시작 참조).

텍스트 인식 기능을 사용하여 파일 또는 클립보드에 복사할 수 있는 텍스트 오버레이로 인식되는 스크린샷의 단어를 보여 주는 애니메이션 GIF입니다.

이미징

이미지 크기 조정 및 선명화(이미지 슈퍼 해상도), 이미지 내의 개체 식별(이미지 개체 추출기), 이미지에 대한 자연어 설명 생성(이미지 설명) 및 이미지에서 개체 제거(개체 지우기). AI 이미징 시작 참조

이미지 슈퍼 해상도

이미지 슈퍼 해상도 APIs 를 사용하면 이미지 선명도 및 크기 조정이 가능합니다.

이미지 슈퍼 해상도 기능을 사용하여 선명하게 하고 크기를 조정하는 단어와 그림이 혼합된 이미지를 보여주는 애니메이션 GIF입니다.

이미지 슈퍼 해상도도 참조하세요.

이미지 객체 추출기

이미지 개체 추출기를 APIs 사용하면 이미지 내의 개체를 식별할 수 있습니다.

한 남자가 지상에서 한 발을 들어 올린 다음 배경 제거를 선택하여 이미지 개체 추출기 기능을 사용하여 흰색 배경에 있는 남자의 이미지를 격리하는 모습을 보여주는 애니메이션 GIF입니다.

이미지 개체 추출기도 참조하세요.

이미지 설명

이미지 설명 APIs 은 자연어로 된 이미지를 설명합니다.

비고

이미지 설명 기능은 중국에서 사용할 수 없습니다.

자연어를 사용하여 소파에서 편안하게 쉬고 있는 푹신하고 털이 많은 개의 이미지를 설명하는 이미지를 설명 기능을 통해 표시하는 잠자는 개를 보여주는 애니메이션 GIF입니다.

이미지 설명도 참조하세요.

객체 삭제

개체 지우기를 APIs 사용하여 이미지에서 개체를 제거할 수 있습니다.

사용자가 개체 지우기 기능을 사용하여 개체를 제거하는 이미지를 보여 주는 애니메이션 GIF입니다.

개체 지우기도 참조하세요.

추가 AI 기능

  • 라이브 번역(아직 지원되지 않음). 청각 장애가 있거나 청각 장애가 있는 사용자를 포함하여 Windows를 사용하는 모든 사용자가 음성 콘텐츠의 캡션을 확인하여 오디오를 더 잘 이해할 수 있도록 도와줍니다(오디오 콘텐츠가 시스템의 기본 언어와 다른 언어로 된 경우에도).

콘텐츠 조정

Windows AI APIs에서 콘텐츠를 조정하는 방법과 민감도 필터를 조정하는 방법을 알아봅니다. Windows AIAPIs를 사용하여 콘텐츠 안전 조정을 참조하세요.

AI 기능을 활용할 때, Windows의 "책임 있는 생성 AI 애플리케이션 및 기능을 개발하는" 지침 을 검토할 것을 권장합니다.

추가 리소스

참고하십시오