Share via


Windows의 AI 샘플 갤러리

로컬 API 및 ML(Machine Learning) 모델, DirectML을 사용한 로컬 하드웨어 가속 및 클라우드 기반 API를 사용하여 Windows 앱을 향상시키는 다양한 방법을 보여 주는 샘플 컬렉션입니다.

로컬 API 및 ML 모델을 사용하여 AI를 사용하여 Windows 앱 향상

이러한 샘플은 로컬 API 및 Machine Learning 모델을 사용하여 AI를 사용하여 Windows 앱을 개선하는 데 도움이 됩니다.

AI 기반 오디오 편집기

AI 오디오 트리머 플러그 인 테스트를 보여 주는 오디오 편집기 샘플 앱의 스크린샷

GitHub 리포지토리: AI 오디오 편집기 샘플

설명: AI 기반 오디오 편집기에서는 AI를 활용하여 오디오 조각을 관련 쿼리와 일치시키는 WinUI 3 오디오 편집 앱을 빌드하는 방법을 보여 줍니다. 예제 사용 사례는 소셜 미디어에서 홍보할 콘텐츠의 짧은 오디오 클립을 만들고자 하는 팟캐스트 작성자일 수 있습니다. 샘플은 로컬 ML 모델 유추를 사용하여 전사 및 의미 체계 검색을 처리합니다.

기능: ONNX 런타임, 위스퍼 모델, Embeddings 모델을 사용하여 로컬 모델 추론

앱 유형: C#, WinUI 3

AI 기반 Notes 앱

AI에서 만든 요약을 보여 주는 AI 지원 노트 샘플 앱의 스크린샷.

GitHub 리포지토리: AI 기반 노트 샘플 앱

설명: 이 AI 기반 노트 작성 애플리케이션은 OCR 텍스트 인식, 로컬 ML 모델을 통한 오디오 전사, 로컬 포함 모델을 통한 의미 체계 검색, 요약, 자동 완성 및 텍스트 추론을 위한 Phi3의 로컬 언어 모델 사용, 실제 데이터에 언어 모델을 접지하기 위한 RAG(검색 증강 세대) 등의 API를 사용하는 방법을 보여 줍니다.

기능: 로컬 모델을 사용하는 의미 체계 검색, 로컬 모델을 사용하는 오디오 전사, Phi3을 사용하는 RAG(Local Retreval Augmented Generation), Phi3을 통한 로컬 텍스트 요약 및 추론, OCR API를 사용하여 이미지에서 텍스트 추출

앱 유형: C#, WinUI 3

PDF 및 Phi3를 사용하여 RAG(검색 증강 세대)

WPF 앱의 RAG PDF 분석기 샘플 스크린샷

GitHub 리포지토리: RAG PDF 분석기 WPF 샘플 앱

설명: 이 WPF 샘플 앱은 PDF 문서의 콘텐츠에 대한 질문에 대답하기 위해 로컬 언어 모델(예: Phi3)을 사용하여 환경을 빌드하는 방법을 보여 줍니다. 샘플은 응답을 생성하기 전에 모델 자체 학습 데이터 외부의 기술 자료 참조하여 답변을 찾습니다. RAG(검색 증강 세대)라고 하는 이 패턴은 언어 모델을 실제 신뢰할 수 있는 데이터에 접지하는 방법의 예입니다.

기능: RAG(검색 증강 생성), ONNX 런타임 생성 AI, DirectML

앱 유형: C#, WPF

Phi3 생성 AI 채팅

WinUI 3 앱에서 Phi3을 사용하는 GenAI 채팅 샘플의 스크린샷

GitHub 리포지토리: Phi3 채팅 WinUI 3 샘플

설명: 이 WinUI 3 앱 샘플은 ONNX 런타임 생성 AI 라이브러리를 사용하여 로컬 언어 모델, 특히 Phi3 SLM(Small Language Model)을 사용하여 채팅 환경을 빌드하는 방법을 보여 줍니다.

기능: Phi3, ONNX 런타임 생성 AI, DirectML

앱 유형: C#, WinUI 3

Windows Studio 효과 샘플

GitHub 리포지토리: Windows Studio 효과 샘플 앱

설명: 이 코드 샘플에서 Windows 애플리케이션에서 카메라 Studio 효과를 제어하는 방법을 알아봅니다. 시스템에서 지원되는 카메라를 사용할 수 있는지(NPU 및 기본 제공 카메라가 있는 디바이스 필요)를 확인한 다음 배경 흐림, 시선 응시 수정 및 자동 프레이밍과 같은 Windows Studio 효과와 연결된 확장된 카메라 컨트롤을 가져오고 설정합니다.

기능: Windows Studio 효과

앱 유형: C#, WPF

DirectML을 통한 로컬 하드웨어 가속

웹에서 하드웨어 가속 안정 확산

안정적인 확산 웹앱 샘플의 스크린샷

GitHub 리포지토리: WebNN 안정 확산 터보

설명: 이 샘플에서는 ONNX 런타임 웹에서 WebNN을 사용하여 DirectML을 사용하여 GPU에서 안정적인 확산을 로컬로 실행하는 방법을 보여 줍니다. SD-Turbo 는 단일 네트워크 평가에서 텍스트 프롬프트에서 광상 이미지를 합성할 수 있는 빠른 생성 텍스트-이미지 모델입니다. 데모에서는 신경망 유추 하드웨어 가속을 위한 전용 하위 수준 API인 WebNN API를 활용하여 AI PC 디바이스에서 2s로 이미지를 생성할 수 있습니다.

기능: 로컬 이미지 생성, WebNN, DirectML

앱 유형: JavaScript, 웹앱

웹의 하드웨어 가속 세그먼트 항목

GitHub 리포지토리: WebNN 세그먼트 무엇이든

설명: 이 샘플에서는 ONNX 런타임 웹에서 WebNN을 사용하여 DirectML을 사용하여 GPU에서 Segment Anything를 로컬로 실행하는 방법을 보여 줍니다. Segment Anything 는 모든 개체를 "잘라내"수 있는 Meta AI의 새로운 AI 모델입니다. 데모에서는 업로드된 이미지에서 모든 개체를 분할할 수 있습니다.

기능: 로컬 이미지 구분, WebNN, DirectML

앱 유형: JavaScript, 웹앱

웹에서 하드웨어 가속 위스퍼

GitHub 리포지토리: WebNN Whisper Base

설명: 이 샘플에서는 ONNX 런타임 웹에서 WebNN을 사용하여 DirectML을 사용하여 GPU 또는 NPU에서 위스퍼 모델의 음성 텍스트 변환 기능을 로컬로 실행하는 방법을 보여 줍니다. 위스퍼 베이스 는 ASR(자동 음성 인식) 및 음성 번역을 위해 미리 학습된 모델입니다. 데모에서는 WebNN API 및 DirectML, 특히 NPU 가속을 통해 구동되는 디바이스 내 유추를 사용하여 음성 텍스트 변환 기능을 경험할 수 있습니다.

기능: 로컬 음성 텍스트 변환, WebNN, DirectML

앱 유형: JavaScript, 웹앱

DirectML을 사용하여 하드웨어 가속 및 미리 최적화된 ONNX 런타임 언어 모델(Phi3, Llama3 등)

DirectML LLM 채팅 UI ONNX 모델 샘플의 스크린샷.

GitHub 리포지토리: Olive 리포지토리의 DirectML 예제

설명: 이 샘플에서는 DirectML을 사용하여 GPU에서 미리 최적화된 ORT(ONNX 런타임) 언어 모델을 로컬로 실행하는 방법을 보여 줍니다. 이 샘플에는 환경을 설정하고 ORT Generate API를 사용하여 미리 학습된 최신 언어 모델을 다운로드하고 Gradio 앱에서 모델을 실행하는 방법에 대한 지침이 포함되어 있습니다.

기능: 하드웨어 가속, GenAI, ONNX, ONNX 런타임, DirectML

앱 유형: Python, Gradio

DirectML을 사용하는 하드웨어 가속 PyTorch 모델(Phi3, Llama3 등)

DirectML PyTorch 샘플의 스크린샷.

GitHub 리포지토리: DirectML PyTorch 샘플

설명: 이 샘플에서는 DirectML을 사용하여 GPU에서 로컬로 PyTorch 언어 모델을 실행하는 방법을 보여 줍니다. 이 샘플에는 환경을 설정하고, 미리 학습된 최신 언어 모델을 다운로드하고, Gradio 앱에서 모델을 실행하는 방법에 대한 지침이 포함되어 있습니다. 이 샘플은 라마 모델, Phi3-mini, Phi2 및 Mistral-7B와 같은 다양한 오픈 소스 언어 모델을 지원합니다.

기능: 하드웨어 가속, PyTorch, DirectML

앱 유형: Python, Gradio

클라우드 API를 사용하여 AI를 사용하여 Windows 앱 향상

더 많은 클라우드 기반 API 샘플은 Azure AI 서비스 설명서에서 찾을 수 있습니다.

WinUI 3/Windows 앱 SDK 앱에 OpenAI 채팅 완료 추가

자습서: WinUI 3/Windows 앱 SDK 앱에 OpenAI 채팅 완료 추가

설명: OpenAI 채팅 완료 기능을 WinUI 3/Windows 앱 SDK 데스크톱 앱에 통합합니다.

기능: OpenAI 채팅 완료

앱 유형: C#, WinUI 3

WinUI 3/Windows 앱 SDK 데스크톱 앱에 DALL-E 추가

자습서: WinUI 3/Windows 앱 SDK 데스크톱 앱에 DALL-E 추가

설명: OpenAI DALL-E 이미지 생성 기능을 WinUI 3/Windows 앱 SDK 데스크톱 앱에 통합합니다.

기능: 이미지 생성

앱 유형: C#, WinUI 3

NET MAUI 및 ChatGPT를 사용하여 추천 앱 만들기

자습서: .NET MAUI 및 ChatGPT를 사용하여 권장 사항 앱 만들기

설명: OpenAI 채팅 완료 기능을 .NET MAUI 데스크톱 앱에 통합합니다.

기능: 이미지 생성

앱 유형: C#, .NET MAUI

.NET MAUI Windows 데스크톱 앱에 DALL-E 추가

자습서: .NET MAUI Windows 데스크톱 앱에 DALL-E 추가

설명: OpenAI DALL-E 이미지 생성 기능을 .NET MAUI 데스크톱 앱에 통합합니다.

기능: 이미지 생성

앱 유형: C#, .NET MAUI

레거시 WinML 샘플

GitHub 리포지토리: GitHub의 WinML 샘플

설명: WinML은 계속 지원되지만 이러한 샘플은 최신 AI 사용을 반영하도록 업데이트되지 않았습니다.