다음을 통해 공유


Windows AI APIs란?

다양한 Windows AI FoundryAPIs아이콘을 보여 주는 이미지.

Windows AI Foundry는 Windows 머신 러닝 (ML)을 통해 사용되는 Windows AI APIs와 하드웨어 추상화된 AI 추론 기능을 통해 다양한 AI(인공 지능) 기능을 제공합니다. Windows AI APIs 를 사용하면 자체 ML(기계 학습) 모델을 찾거나 실행하거나 최적화할 필요 없이 AI 기능을 사용할 수 있습니다. Copilot+ PC에서 Windows AI Foundry 전원을 공급하는 모델은 백그라운드에서 로컬 및 지속적으로 실행됩니다.

WinUI와 함께 사용하는 API 방법을 보여 주는 전체 앱은 참조하세요.

첫 번째 AI 기반 Windows 앱 빌드

Visual Studio 및 일부 간단한 Windows AIAPIs를 사용하여 첫 번째 Windows 앱을 빌드하려면 필수 구성 요소를 충족하고 Windows AIAPIs를 사용하여 앱 빌드를 시작할 때 제공된 예제 코드를 사용하세요.

여기에서 APIs, Imaging walthroughOCR walthrough와 같은 특정 Windows AI 를 활용하는 앱을 빌드하는 짧은 자습서로 이동할 수 있습니다.

PC에서 APIs와 모델을 사용해 보기.

AI Dev Gallery 은 Microsoft Store에서 사용할 수 있는 데모 앱으로, Windows AI APIs 및 모델을 빠르게 다운로드, 사용해 보기 및 사용할 수 있습니다.

에서 AI Dev GalleryWindows AI APIs 탭 메뉴 항목을 선택한 다음, Phi Silica 샘플을 선택합니다. 디바이스에서 모델을 이미 사용할 수 있는 경우 해당 샘플이 바로 실행됩니다. 그렇지 않은 경우 모델 요청을 선택하여 모델을 다운로드합니다. 다운로드되면 해당 샘플이 활성화됩니다. AI Dev Gallery의 AI Dev Gallery에 대해 자세히 알아보세요.

사용 가능한 항목의 개요 APIs

다음은 Windows 앱에서 활용할 수 있는 몇 가지 즉시 사용할 수 있는 AI 기능입니다.

  • 피 실리카. 즉시 사용할 수 있는 로컬 언어 모델입니다. 피 실리카 시작하기를 참조하세요.
  • AI 텍스트 인식. 이미지의 텍스트를 인식하고 이미지/pdf를 검색 가능한 텍스트로 변환합니다. AI 텍스트 인식 시작 참조
  • AI 이미징. AI(이미지 슈퍼 해상도)를 사용하여 이미지의 크기를 조정하고 선명하게 할 뿐만 아니라 이미지 내의 개체를 식별합니다(이미지 구분). AI 이미징 시작 참조
  • Windows Studio Effects; 디바이스의 기본 제공 카메라 및 마이크에 AI 효과를 적용합니다. 개요(미리 보기)를 참조하세요Windows Studio Effects.

피 실리카

ChatGPT를 지원하는 OpenAI의 LLM(GPT 대규모 언어 모델)과 마찬가지로, Phi는 Microsoft Research가 로컬 디바이스에서 언어 처리 작업을 수행하기 위해 개발한 SLM(Small Language Model)입니다. Phi Silica는 NPU(신경 처리 장치)가 있는 Windows 디바이스용으로 특별히 설계되어 텍스트 생성 및 대화 기능을 디바이스에서 직접 고성능 하드웨어 가속 방식으로 실행할 수 있습니다. 피 실리카는 중국에서 사용할 수 없습니다.

AI 채팅 프롬프트 읽기를 보여주는 애니메이션 GIF는 자신을 소개하고 Phi Silica 기능을 사용하여 응답을 생성합니다.

또한 Phi Silica 입문하기도 참조하세요.

팁 (조언)

접근성 및 가독성을 향상시키기 위해 이 페이지는 기본 보기에서 스틸 이미지를 사용합니다. 이미지를 클릭하여 애니메이션 버전을 볼 수 있습니다.

텍스트 인식

텍스트 인식을 APIs 사용하면 이미지의 텍스트를 인식할 수 있으며, 다양한 유형의 문서(예: 스캔한 종이 문서, PDF 파일 및 디지털 카메라에서 캡처한 이미지)의 로컬 디바이스에서 편집 가능하고 검색 가능한 데이터로 변환할 수 있습니다.

텍스트 인식 기능을 사용하여 파일 또는 클립보드에 복사할 수 있는 텍스트 오버레이로 인식되는 스크린샷의 단어를 보여 주는 애니메이션 GIF입니다.

AI 텍스트 인식 시작도 참조하세요.

이미지 슈퍼 해상도

이미지 슈퍼 해상도 APIs 를 사용하면 이미지 선명도 및 크기 조정이 가능합니다.

이미지 슈퍼 해상도 기능을 사용하여 선명하게 하고 크기를 조정하는 단어와 그림이 혼합된 이미지를 보여주는 애니메이션 GIF입니다.

또한 이미지 슈퍼 해상도로 무엇을 할 수 있나요?를 참조하세요.

이미지 구분

이미지 구분 APIs 을 사용하면 이미지를 세분화할 수 있습니다.

한 남자가 지상에서 한 발을 들어 올린 다음 배경 제거를 선택하여 이미지 구분 기능을 사용하여 흰색 배경에 있는 남자의 이미지를 격리하는 애니메이션 GIF입니다.

또한 이미지 구분으로 무엇을 할 수 있나요?를 참조하세요.

이미지 설명

이미지 설명 APIs 은 자연어로 된 이미지를 설명합니다. 이미지 설명 기능은 중국에서 사용할 수 없습니다.

자연어를 사용하여 소파에서 편안하게 쉬고 있는 푹신하고 털이 많은 개의 이미지를 설명하는 이미지를 설명 기능을 통해 표시하는 잠자는 개를 보여주는 애니메이션 GIF입니다.

이미지에서 텍스트 설명 가져오기도 참조하세요.

객체 삭제

개체 지우기를 APIs 사용하면 이미지에서 개체를 제거할 수 있습니다.

사용자가 개체 지우기 기능을 사용하여 개체를 제거하는 이미지를 보여 주는 애니메이션 GIF입니다.

개체 지우기 시작도 참조하세요.

추가 AI 기능

  • Windows Studio Effects; 호환되는 NPU(신경 처리 장치)가 있는 Windows 디바이스는 디바이스의 기본 제공 카메라 및 마이크 설정에 통합 Windows Studio Effects 됩니다. 배경 흐림 효과, 눈 접촉 보정, 자동 프레이밍, 세로 조명 보정, 크리에이티브 필터, 음성 포커스 등 AI를 사용하는 특수 효과를 적용하여 배경 노이즈를 필터링할 수 있습니다. 개요(미리 보기)를 참조하세요Windows Studio Effects.

  • Recall: Recall 사용하면 문서, 이미지, 웹 사이트 등과 같은 과거 활동에서 항목을 빠르게 찾을 수 있습니다. 개발자는 Recall 앱으로 사용자 환경을 보강할 수 있습니다. 이러한 통합을 통해 사용자는 앱에서 중단된 위치를 파악하여 Windows와 앱 간에 앱 참여와 사용자의 원활한 흐름을 개선할 수 있습니다. 개요를 참조하세요Recall.

  • 라이브 캡션 번역(아직 지원되지 않음). 청각 장애가 있거나 청각 장애가 있는 사용자를 포함하여 Windows를 사용하는 모든 사용자가 음성 콘텐츠의 캡션을 확인하여 오디오를 더 잘 이해할 수 있도록 도와줍니다(오디오 콘텐츠가 시스템의 기본 언어와 다른 언어로 된 경우에도).

콘텐츠 조정

콘텐츠를 조정하는 방법과 Windows AI Foundry 민감도 필터를 조정하는 방법을 알아봅니다. 를 사용하여 콘텐츠 안전 조정Windows AI Foundry을 참조하세요.

AI 기능을 활용할 때, Windows의 "책임 있는 생성 AI 애플리케이션 및 기능을 개발하는" 지침 을 검토할 것을 권장합니다.

추가 리소스

참고하십시오