Windows의 AI 샘플 갤러리
로컬 API 및 ML(Machine Learning) 모델, DirectML을 사용한 로컬 하드웨어 가속 및 클라우드 기반 API를 사용하여 Windows 앱을 향상시키는 다양한 방법을 보여 주는 샘플 컬렉션입니다.
로컬 API 및 ML 모델을 사용하여 AI를 사용하여 Windows 앱 향상
이러한 샘플은 로컬 API 및 Machine Learning 모델을 사용하여 AI를 사용하여 Windows 앱을 개선하는 데 도움이 됩니다.
AI 기반 오디오 편집기
GitHub 리포지토리: AI 오디오 편집기 샘플
설명: AI 기반 오디오 편집기에서는 AI를 활용하여 오디오 조각을 관련 쿼리와 일치시키는 WinUI 3 오디오 편집 앱을 빌드하는 방법을 보여 줍니다. 예제 사용 사례는 소셜 미디어에서 홍보할 콘텐츠의 짧은 오디오 클립을 만들고자 하는 팟캐스트 작성자일 수 있습니다. 샘플은 로컬 ML 모델 유추를 사용하여 전사 및 의미 체계 검색을 처리합니다.
기능: ONNX 런타임, 위스퍼 모델, Embeddings 모델을 사용하여 로컬 모델 추론
AI 기반 Notes 앱
GitHub 리포지토리: AI 기반 노트 샘플 앱
설명: 이 AI 기반 노트 작성 애플리케이션은 OCR 텍스트 인식, 로컬 ML 모델을 통한 오디오 전사, 로컬 포함 모델을 통한 의미 체계 검색, 요약, 자동 완성 및 텍스트 추론을 위한 Phi3의 로컬 언어 모델 사용, 실제 데이터에 언어 모델을 접지하기 위한 RAG(검색 증강 세대) 등의 API를 사용하는 방법을 보여 줍니다.
기능: 로컬 모델을 사용하는 의미 체계 검색, 로컬 모델을 사용하는 오디오 전사, Phi3을 사용하는 RAG(Local Retreval Augmented Generation), Phi3을 통한 로컬 텍스트 요약 및 추론, OCR API를 사용하여 이미지에서 텍스트 추출
PDF 및 Phi3를 사용하여 RAG(검색 증강 세대)
GitHub 리포지토리: RAG PDF 분석기 WPF 샘플 앱
설명: 이 WPF 샘플 앱은 PDF 문서의 콘텐츠에 대한 질문에 대답하기 위해 로컬 언어 모델(예: Phi3)을 사용하여 환경을 빌드하는 방법을 보여 줍니다. 샘플은 응답을 생성하기 전에 모델 자체 학습 데이터 외부의 기술 자료 참조하여 답변을 찾습니다. RAG(검색 증강 세대)라고 하는 이 패턴은 언어 모델을 실제 신뢰할 수 있는 데이터에 접지하는 방법의 예입니다.
기능: RAG(검색 증강 생성), ONNX 런타임 생성 AI, DirectML
Phi3 생성 AI 채팅
GitHub 리포지토리: Phi3 채팅 WinUI 3 샘플
설명: 이 WinUI 3 앱 샘플은 ONNX 런타임 생성 AI 라이브러리를 사용하여 로컬 언어 모델, 특히 Phi3 SLM(Small Language Model)을 사용하여 채팅 환경을 빌드하는 방법을 보여 줍니다.
기능: Phi3, ONNX 런타임 생성 AI, DirectML
Windows Studio 효과 샘플
GitHub 리포지토리: Windows Studio 효과 샘플 앱
설명: 이 코드 샘플에서 Windows 애플리케이션에서 카메라 Studio 효과를 제어하는 방법을 알아봅니다. 시스템에서 지원되는 카메라를 사용할 수 있는지(NPU 및 기본 제공 카메라가 있는 디바이스 필요)를 확인한 다음 배경 흐림, 시선 응시 수정 및 자동 프레이밍과 같은 Windows Studio 효과와 연결된 확장된 카메라 컨트롤을 가져오고 설정합니다.
DirectML을 통한 로컬 하드웨어 가속
웹에서 하드웨어 가속 안정 확산
GitHub 리포지토리: WebNN 안정 확산 터보
설명: 이 샘플에서는 ONNX 런타임 웹에서 WebNN을 사용하여 DirectML을 사용하여 GPU에서 안정적인 확산을 로컬로 실행하는 방법을 보여 줍니다. SD-Turbo 는 단일 네트워크 평가에서 텍스트 프롬프트에서 광상 이미지를 합성할 수 있는 빠른 생성 텍스트-이미지 모델입니다. 데모에서는 신경망 유추 하드웨어 가속을 위한 전용 하위 수준 API인 WebNN API를 활용하여 AI PC 디바이스에서 2s로 이미지를 생성할 수 있습니다.
기능: 로컬 이미지 생성, WebNN, DirectML
앱 유형: JavaScript, 웹앱
웹의 하드웨어 가속 세그먼트 항목
GitHub 리포지토리: WebNN 세그먼트 무엇이든
설명: 이 샘플에서는 ONNX 런타임 웹에서 WebNN을 사용하여 DirectML을 사용하여 GPU에서 Segment Anything를 로컬로 실행하는 방법을 보여 줍니다. Segment Anything 는 모든 개체를 "잘라내"수 있는 Meta AI의 새로운 AI 모델입니다. 데모에서는 업로드된 이미지에서 모든 개체를 분할할 수 있습니다.
기능: 로컬 이미지 구분, WebNN, DirectML
앱 유형: JavaScript, 웹앱
웹에서 하드웨어 가속 위스퍼
GitHub 리포지토리: WebNN Whisper Base
설명: 이 샘플에서는 ONNX 런타임 웹에서 WebNN을 사용하여 DirectML을 사용하여 GPU 또는 NPU에서 위스퍼 모델의 음성 텍스트 변환 기능을 로컬로 실행하는 방법을 보여 줍니다. 위스퍼 베이스 는 ASR(자동 음성 인식) 및 음성 번역을 위해 미리 학습된 모델입니다. 데모에서는 WebNN API 및 DirectML, 특히 NPU 가속을 통해 구동되는 디바이스 내 유추를 사용하여 음성 텍스트 변환 기능을 경험할 수 있습니다.
기능: 로컬 음성 텍스트 변환, WebNN, DirectML
앱 유형: JavaScript, 웹앱
DirectML을 사용하여 하드웨어 가속 및 미리 최적화된 ONNX 런타임 언어 모델(Phi3, Llama3 등)
GitHub 리포지토리: Olive 리포지토리의 DirectML 예제
설명: 이 샘플에서는 DirectML을 사용하여 GPU에서 미리 최적화된 ORT(ONNX 런타임) 언어 모델을 로컬로 실행하는 방법을 보여 줍니다. 이 샘플에는 환경을 설정하고 ORT Generate API를 사용하여 미리 학습된 최신 언어 모델을 다운로드하고 Gradio 앱에서 모델을 실행하는 방법에 대한 지침이 포함되어 있습니다.
기능: 하드웨어 가속, GenAI, ONNX, ONNX 런타임, DirectML
앱 유형: Python, Gradio
DirectML을 사용하는 하드웨어 가속 PyTorch 모델(Phi3, Llama3 등)
GitHub 리포지토리: DirectML PyTorch 샘플
설명: 이 샘플에서는 DirectML을 사용하여 GPU에서 로컬로 PyTorch 언어 모델을 실행하는 방법을 보여 줍니다. 이 샘플에는 환경을 설정하고, 미리 학습된 최신 언어 모델을 다운로드하고, Gradio 앱에서 모델을 실행하는 방법에 대한 지침이 포함되어 있습니다. 이 샘플은 라마 모델, Phi3-mini, Phi2 및 Mistral-7B와 같은 다양한 오픈 소스 언어 모델을 지원합니다.
기능: 하드웨어 가속, PyTorch, DirectML
앱 유형: Python, Gradio
클라우드 API를 사용하여 AI를 사용하여 Windows 앱 향상
더 많은 클라우드 기반 API 샘플은 Azure AI 서비스 설명서에서 찾을 수 있습니다.
WinUI 3/Windows 앱 SDK 앱에 OpenAI 채팅 완료 추가
자습서: WinUI 3/Windows 앱 SDK 앱에 OpenAI 채팅 완료 추가
설명: OpenAI 채팅 완료 기능을 WinUI 3/Windows 앱 SDK 데스크톱 앱에 통합합니다.
기능: OpenAI 채팅 완료
WinUI 3/Windows 앱 SDK 데스크톱 앱에 DALL-E 추가
자습서: WinUI 3/Windows 앱 SDK 데스크톱 앱에 DALL-E 추가
설명: OpenAI DALL-E 이미지 생성 기능을 WinUI 3/Windows 앱 SDK 데스크톱 앱에 통합합니다.
기능: 이미지 생성
NET MAUI 및 ChatGPT를 사용하여 추천 앱 만들기
자습서: .NET MAUI 및 ChatGPT를 사용하여 권장 사항 앱 만들기
설명: OpenAI 채팅 완료 기능을 .NET MAUI 데스크톱 앱에 통합합니다.
기능: 이미지 생성
.NET MAUI Windows 데스크톱 앱에 DALL-E 추가
자습서: .NET MAUI Windows 데스크톱 앱에 DALL-E 추가
설명: OpenAI DALL-E 이미지 생성 기능을 .NET MAUI 데스크톱 앱에 통합합니다.
기능: 이미지 생성
레거시 WinML 샘플
GitHub 리포지토리: GitHub의 WinML 샘플
설명: WinML은 계속 지원되지만 이러한 샘플은 최신 AI 사용을 반영하도록 업데이트되지 않았습니다.
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기