AI(인공 지능) 는 컴퓨터가 지능형 인간의 행동을 모방할 수 있는 기술입니다. AI를 사용하면 컴퓨터에서 다음을 수행할 수 있습니다.
데이터를 분석하여 이미지 및 비디오를 만듭니다.
음성을 분석하고 합성합니다.
자연스러운 방식으로 구두로 상호 작용합니다.
예측을 수행하고 새 데이터를 생성합니다.
설계자는 애플리케이션 구성 요소에서 인공 지능을 사용하여 기능을 수행하거나 기존 논리 또는 처리가 금지되거나 구현이 거의 불가능한 결정을 내릴 수 있도록 워크로드를 디자인합니다. 솔루션을 설계하는 설계자는 AI 및 기계 학습 환경과 Azure가 워크로드 디자인에 통합하기 위한 솔루션을 제공하는 방법을 이해하는 것이 중요합니다.
시작하기
Azure 아키텍처 센터는 시나리오에 적용하고 특정 시나리오를 설계하는 데 도움이 되는 예제 아키텍처, 아키텍처 가이드, 아키텍처 기준 및 아이디어를 제공합니다. AI/ML 구성 요소가 포함된 워크로드는 Azure 지침에서 Well-Architected Framework의 AI 워크로드를 따르는 설계자가 설계해야 합니다. 이 Well-Architected 프레임워크 지침에는 아키텍처의 5가지 핵심 요소에서 AI/ML 워크로드에 영향을 주는 원칙 및 디자인 가이드가 포함되어 있습니다. 이러한 권장 사항은 Azure 아키텍처 센터에 제시된 시나리오 및 콘텐츠에서 구현되어야 합니다.
AI 개념
알고리즘
알고리즘 또는 기계 학습 알고리즘은 인간이 복잡한 데이터 세트에서 의미를 탐색, 분석 및 찾는 데 도움이 되는 코드 조각입니다. 각 알고리즘은 특정 목표를 달성하기 위해 머신이 따를 수 있는 명확한 단계별 지침의 한정된 세트입니다. 기계 학습 모델에서 목표는 인간이 예측을 수행하거나 정보를 분류하는 데 사용할 수 있는 패턴을 설정하거나 검색하는 것입니다. 알고리즘은 애완 동물이 고양이, 개, 물고기, 조류 또는 도마뱀인지 여부를 확인하는 방법을 설명 할 수 있습니다. 훨씬 더 복잡한 또 다른 알고리즘은 쓰기 또는 음성 언어를 식별하고, 해당 단어를 분석하고, 다른 언어로 번역한 다음, 번역에서 정확도를 확인하는 방법을 설명할 수 있습니다.
워크로드를 디자인할 때 작업에 적합한 알고리즘 패밀리를 선택하고 사용 가능한 다양한 알고리즘을 평가하여 적합한 알고리즘을 찾아야 합니다.
기계 학습 은 알고리즘을 사용하여 예측 모델을 만드는 AI 기술입니다. 이 알고리즘은 데이터 필드를 구문 분석하고 데이터 내에서 찾은 패턴을 사용하여 모델을 생성하여 해당 데이터에서 "학습"하는 데 사용됩니다. 그런 다음 이러한 모델을 사용하여 정보에 입각한 예측 또는 새로운 데이터에 대한 결정을 내립니다.
예측 모델은 알려진 데이터에 대해 유효성을 검사하고 특정 비즈니스 시나리오에 대해 선택된 성능 메트릭으로 측정한 다음 필요에 따라 조정합니다. 이러한 학습 및 유효성 검사 프로세스를 학습이라고 합니다. 주기적인 재학습을 통해 ML 모델은 시간이 지남에 따라 개선됩니다.
워크로드 디자인과 관련하여 과거 관찰을 안정적으로 사용하여 향후 상황을 예측할 수 있는 상황이 있는 경우 기계 학습을 사용하는 것이 좋습니다. 이러한 관찰은 한 형태의 동물을 다른 동물에서 감지하는 컴퓨터 비전과 같은 보편적인 진실일 수 있으며, 이러한 관찰은 과거 보증 청구 데이터를 기반으로 어셈블리 라인에서 잠재적 어셈블리 실수를 감지하는 컴퓨터 비전과 같은 상황에 따라 다를 수 있습니다.
딥 러닝 은 자체 데이터 처리를 통해 학습할 수 있는 ML의 한 유형입니다. 기계 학습과 마찬가지로 알고리즘을 사용하여 데이터를 분석하지만 많은 입력, 출력 및 처리 계층이 포함된 인공 신경망을 사용합니다. 각 계층은 다른 방식으로 데이터를 처리할 수 있으며, 한 계층의 출력은 다음 계층에 대한 입력이 됩니다. 이를 통해 딥 러닝은 기존 기계 학습보다 더 복잡한 모델을 만들 수 있습니다.
워크로드 디자이너로서 이 옵션을 사용하려면 고도로 사용자 지정되거나 예비 모델을 생성하는 데 많은 투자가 필요합니다. 일반적으로 워크로드에 딥 러닝을 추가하기 전에 이 문서에 제시된 다른 솔루션을 고려합니다.
생성 AI 는 자연어, 컴퓨터 비전, 오디오 또는 이미지 입력과 같은 다양한 형태의 콘텐츠를 기반으로 새로운 원본 콘텐츠를 생성하도록 모델을 학습하는 인공 지능의 한 형태입니다. 생성 AI를 사용하면 일반적인 일상적인 언어로 원하는 출력을 설명할 수 있으며, 모델은 적절한 텍스트, 이미지, 코드 등을 만들어 응답할 수 있습니다. 생성 AI 애플리케이션의 몇 가지 예는 다음과 같습니다.
Microsoft Copilot 는 주로 사용자가 코드, 문서 및 기타 텍스트 기반 콘텐츠를 작성하는 데 도움을 줄 수 있는 사용자 인터페이스입니다. 인기 있는 OpenAI 모델을 기반으로 하며 광범위한 Microsoft 애플리케이션 및 사용자 환경에 통합됩니다.
Azure OpenAI 는 o1-preview, o1-mini, GPT-4o, GPT-4o mini, GPT-4 Turbo with Vision, GPT-4, GPT-3.5-Turbo 및 Embeddings 모델 시리즈와 같은 OpenAI의 강력한 언어 모델에 대한 액세스를 제공하는 서비스로서의 개발 플랫폼입니다. 이러한 모델은 다음과 같은 특정 작업에 맞게 조정할 수 있습니다.
콘텐츠 생성
콘텐츠 요약
이미지 이해
의미 체계 검색
자연어에서 코드 변환으로 변환합니다.
언어 모델
언어 모델은 텍스트 생성 및 감정 분석과 같은 NLP(자연어 처리) 작업에 중점을 둔 생성 AI의 하위 집합입니다. 이러한 모델은 지정된 상황에서 발생하는 단어 또는 단어 시퀀스의 가능성을 기반으로 자연어를 나타냅니다.
기존 언어 모델은 특정 작업에 대해 잘 레이블이 지정된 텍스트 데이터 세트에 대해 모델을 학습하는 연구 목적으로 감독 설정에서 사용되었습니다. 미리 학습된 언어 모델은 AI를 시작하는 접근성 있는 방법을 제공하며 최근 몇 년 동안 더 널리 사용되고 있습니다. 이러한 모델은 딥 러닝 신경망을 사용하여 인터넷에서 대규모 텍스트 corpora에 대해 학습되며 특정 작업에 대한 더 작은 데이터 세트를 미세 조정할 수 있습니다.
언어 모델의 크기는 모델이 입력 데이터를 처리하고 출력을 생성하는 방법을 결정하는 매개 변수 수 또는 가중치에 따라 결정됩니다. 모델의 예측과 실제 데이터 간의 차이를 최소화하기 위해 모델 계층 내의 가중치를 조정하여 학습 프로세스 중에 매개 변수를 학습합니다. 모델에 매개 변수가 많을수록 모델이 더 복잡하고 표현력이 풍부해지지만, 학습하고 사용하는 데 계산 비용이 더 많이 듭니다.
일반적으로 소규모 언어 모델에는 100억 개 미만의 매개 변수가 있고, 대규모 언어 모델에는 100억 개가 넘는 매개 변수가 있습니다. 예를 들어 Microsoft Phi-3 모델 제품군에는 미니(38억 개의 매개 변수), 작은(70억 개의 매개 변수) 및 중간(140억 개의 매개 변수)의 크기가 다른 세 가지 버전이 있습니다.
언어 모델의 가용성은 디지털 부조종사 및 연결된 도메인별 에이전트를 통해 애플리케이션 및 시스템과 상호 작용하는 새로운 방법의 출현으로 이어졌습니다. Copilot은 보통 채팅 인터페이스로 애플리케이션에 통합되는 생성형 AI 도우미입니다. 이러한 애플리케이션에서 일반적인 작업에 대한 컨텍스트화된 지원을 제공합니다.
Microsoft Copilot 는 광범위한 Microsoft 애플리케이션 및 사용자 환경에 통합되어 있습니다. 타사 개발자가 Microsoft Copilot를 사용하여 사용자 환경을 확장하거나 사용자 지정할 수 있는 자체 플러그 인을 만들 수 있는 개방형 아키텍처를 기반으로 합니다. 또한 타사 개발자는 동일한 개방형 아키텍처를 사용하여 자체 Copilot을 만들 수 있습니다.
RAG(검색 증강 세대) 는 공용 데이터에서만 학습된 ChatGPT와 같은 LLM(대규모 언어 모델)의 기능을 보강하는 아키텍처 패턴입니다. 이 패턴을 사용하면 컨텍스트에서 사용자 요청과 관련된 접지 데이터를 제공하는 검색 시스템을 추가할 수 있습니다. 정보 검색 시스템을 추가하면 응답을 작성할 때 언어 모델에서 사용하는 접지 데이터를 제어할 수 있습니다. RAG 아키텍처를 사용하면 생성 AI를 벡터화된 문서, 이미지 및 기타 데이터 형식에서 제공하는 콘텐츠로 범위를 지정할 수 있습니다. RAG는 벡터 검색 스토리지로 제한되지는 않습니다. 그러나 패턴은 데이터 저장소 기술과 함께 적용할 수 있습니다.
Azure AI 서비스를 통해 개발자와 조직은 기본 제공, 미리 빌드된 사용자 지정 가능한 API 및 모델을 사용하여 지능적이고, 시장에 대비하고, 책임 있는 애플리케이션을 만들 수 있습니다. 사용에는 대화, 검색, 모니터링, 번역, 음성, 비전 및 의사 결정에 대한 자연어 처리가 포함됩니다.
OpenAI의 GPT 모델과 같은 LLM(대규모 언어 모델)은 다양한 도메인 및 작업에서 자연어를 생성할 수 있는 강력한 도구입니다. 이러한 모델 사용을 고려할 때 데이터 개인 정보 보호, 윤리적 사용, 정확도 및 바이어스와 같은 요소를 고려합니다.
Phi 개방형 모델은 생성 AI 솔루션을 위한 작고 컴퓨팅 집약적인 모델입니다. SLM(작은 언어 모델)은 큰 언어 모델보다 더 효율적이고 해석 가능하며 설명이 가능할 수 있습니다.
워크로드를 디자인할 때 언어 모델을 호스트된 솔루션으로 사용하거나, 계량된 API 뒤에 있거나, 프로세스에서 또는 적어도 소비자와 동일한 컴퓨팅에서 호스트할 수 있는 많은 작은 언어 모델에 대해 사용할 수 있습니다. 솔루션에서 언어 모델을 사용하는 경우 사용 사례에 최적화된 솔루션을 사용할 수 있도록 선택한 언어 모델 및 사용 가능한 호스팅 옵션을 고려합니다.
AI 개발 플랫폼 및 도구
Azure Machine Learning Service
Azure Machine Learning은 모델을 빌드하고 배포하는 기계 학습 서비스입니다. Azure Machine Learning은 대규모로 기계 학습 모델 및 파이프라인을 학습하고 배포할 수 있도록 웹 인터페이스 및 SDK를 제공합니다. PyTorch, TensorFlow 및 scikit-learn과 같은 오픈 소스 Python 프레임워크와 함께 이러한 기능을 사용하세요.
자동화된 ML 또는 AutoML이라고도 하는 자동화된 기계 학습은 기계 학습 모델 개발의 시간이 오래 걸리고 반복적인 작업을 자동화하는 프로세스입니다. 데이터 과학자, 분석가 및 개발자는 모델 품질을 유지하면서 확장성, 효율성 및 생산성이 높은 ML 모델을 빌드할 수 있습니다.
프롬프트 흐름 은 아이디어, 프로토타입 생성, 테스트, 평가에서 프로덕션 배포 및 모니터링에 이르기까지 생성 AI 애플리케이션의 엔드투엔드 개발 주기를 간소화하도록 설계된 개발 도구 모음입니다. 모듈식 오케스트레이션 및 흐름 엔진에서 작업을 표현하여 프롬프트 엔지니어링을 지원합니다.
azure AI Foundry 포괄적인 플랫폼을 사용하여 생성 AI 앱 및 API를 책임감 있게 실험, 개발 및 배포할 수 있습니다. Azure AI Foundry 포털을 사용하면 AI 모델을 빌드, 학습, 미세 조정 및 배포하는 데 도움이 되는 Azure AI 서비스, 기본 모델, 플레이그라운드 및 리소스에 액세스할 수 있습니다.
또한 성능 향상을 위해 모델 응답을 평가하고 프롬프트 흐름을 사용하여 프롬프트 애플리케이션 구성 요소를 오케스트레이션할 수 있습니다.
Azure Copilot Studio 는 Microsoft 365에서 Microsoft Copilot를 확장하고 내부 및 외부 시나리오에 대한 사용자 지정 부조종사를 빌드하는 데 사용됩니다. Copilot Studio를 사용하면 사용자는 포괄적인 제작 캔버스를 사용하여 부조종사를 디자인, 테스트 및 게시할 수 있습니다. 사용자는 생성 AI 지원 대화를 쉽게 만들고, 기존 부조종사에 대한 응답에 대한 더 큰 제어를 제공하며, 특정 자동화된 워크플로를 통해 생산성을 높일 수 있습니다.
AI용 데이터 플랫폼
Microsoft Fabric
Microsoft Fabric은 통합 솔루션이 필요한 엔터프라이즈용으로 설계된 엔드투엔드 분석 및 데이터 플랫폼입니다. 워크로드 팀은 이러한 시스템의 데이터에 대한 액세스 권한을 부여할 수 있습니다. 데이터 이동, 처리, 수집, 변환, 실시간 이벤트 라우팅 및 보고서 작성을 포함합니다. 데이터 엔지니어링, Data Factory, 데이터 과학, 실시간 분석, Data Warehouse 및 데이터베이스를 포함한 포괄적인 서비스 제품군을 제공합니다.
Microsoft Fabric은 개별 구성 요소를 응집력 있는 스택에 통합합니다. 다른 데이터베이스 또는 Data Warehouse를 사용하는 대신 OneLake를 사용하여 데이터 스토리지를 중앙 집중화할 수 있습니다. AI 기능은 패브릭 내에 포함되어 있으므로 수동 통합이 필요하지 않습니다.
부조종사 및 기타 생성 AI 기능을 사용하면 Microsoft Fabric 및 Power BI에서 데이터를 변환 및 분석하고, 인사이트를 생성하고, 시각화 및 보고서를 만들 수 있습니다. 사용자 고유의 부조종사 또는 다음 미리 빌드된 부조종사 중 하나를 선택할 수 있습니다.
Microsoft Fabric AI 기술을 사용하면 데이터에 대한 질문에 답변하는 쿼리를 생성하도록 생성 AI 시스템을 구성할 수 있습니다. AI 기술을 구성한 후 동료와 공유할 수 있으며, 동료는 일반 영어로 질문을 할 수 있습니다. AI는 질문에 따라 해당 질문에 답변하는 데이터에 대한 쿼리를 생성합니다.
Apache Spark는 메모리 내 처리를 지원하여 빅 데이터 분석 애플리케이션의 성능을 향상하는 병렬 처리 프레임워크입니다. Spark는 메모리 내 클러스터 컴퓨팅을 위한 기본 형식을 제공합니다. Spark 작업은 데이터를 로드하고 메모리에 캐시하고 반복적으로 쿼리할 수 있으며, 이는 Hadoop과 같은 디스크 기반 애플리케이션보다 빠릅니다.
Azure Fabric의 Apache Spark
Microsoft Fabric 런타임은 데이터 엔지니어링 및 데이터 과학 환경을 실행하고 관리할 수 있도록 하는 Apache Spark를 기반으로 하는 Azure 통합 플랫폼입니다. 내부 및 오픈 소스 소스의 주요 구성 요소를 결합하여 고객에게 포괄적인 솔루션을 제공합니다.
Fabric 런타임의 주요 구성 요소:
Apache Spark - 대규모 데이터 처리 및 분석 작업을 가능하게 하는 강력한 오픈 소스 분산 컴퓨팅 라이브러리입니다. Apache Spark는 데이터 엔지니어링 및 데이터 과학 환경을 위한 다재다능하고 고성능 플랫폼을 제공합니다.
Delta Lake - Apache Spark에 ACID 트랜잭션 및 기타 데이터 안정성 기능을 제공하는 오픈 소스 스토리지 계층입니다. Fabric 런타임 내에 통합된 Delta Lake는 데이터 처리 기능을 향상시키고 여러 동시 작업에서 데이터 일관성을 보장합니다.
Java/Scala, Python 및 R에 대한 기본 수준 패키지 - 다양한 프로그래밍 언어 및 환경을 지원하는 패키지입니다. 이러한 패키지는 자동으로 설치 및 구성되므로 개발자는 데이터 처리 작업에 기본 프로그래밍 언어를 적용할 수 있습니다.
Microsoft Fabric 런타임은 강력한 오픈 소스 운영 체제를 기반으로 구축되어 다양한 하드웨어 구성 및 시스템 요구 사항과의 호환성을 보장합니다.
Azure Databricks는 원클릭 설정, 간소화된 워크플로, 데이터 과학자, 엔지니어, 비즈니스 분석이 간의 협업을 위한 대화형 작업 영역을 갖춘 Apache Spark 기반 분석 플랫폼입니다.
Databricks Runtime ML(Databricks Runtime for Machine Learning)을 사용하면 분산 학습에 필요한 모든 라이브러리로 Databricks 클러스터를 시작할 수 있습니다. 기계 학습 및 데이터 과학을 위한 환경을 제공합니다. 또한 TensorFlow, PyTorch, Keras 및 XGBoost를 비롯한 여러 자주 사용되는 라이브러리가 포함되어 있습니다. 또한 Horovod를 사용하여 분산 학습을 지원합니다.
Azure HDInsight의 Apache Spark는 Microsoft가 Apache Spark를 클라우드에서 구현한 것입니다. HDInsight의 Spark 클러스터는 Azure Storage 및 Azure Data Lake Storage와 호환되므로 HDInsight Spark 클러스터를 사용하여 Azure에 저장된 데이터를 처리할 수 있습니다.
Apache Spark용 Microsoft machine learning 라이브러리는 SynapseML(MMLSpark로도 알려짐)입니다. Spark 에코시스템에 많은 딥 러닝 및 데이터 과학 도구, 네트워킹 기능 및 프로덕션 등급 성능을 추가하는 오픈 소스 라이브러리입니다.
SynapseML 기능에 대해 자세히 알아봅니다.
Azure HDInsight 개요. 빠른 시작 및 자습서에 대한 포인터와 함께 기능, 클러스터 아키텍처 및 사용 사례에 대한 기본 정보입니다.
Fabric의 OneLake는 전체 조직에 맞게 조정된 통합되고 논리적인 데이터 레이크입니다. 모든 분석 데이터의 중앙 허브 역할을 하며 모든 Microsoft Fabric 테넌트에 포함됩니다. Fabric의 OneLake는 Data Lake Storage Gen2의 기초를 기반으로 합니다.
Fabric의 OneLake:
구조적 및 비구조적 파일 형식을 지원합니다.
모든 테이블 형식 데이터를 Delta Parquet 형식으로 저장합니다.
기본적으로 제어되는 테넌트 경계 내에 단일 데이터 레이크를 제공합니다.
조직에서 소유권 및 액세스 정책을 배포할 수 있도록 테넌트 내에서 작업 영역 만들기를 지원합니다.
데이터에 액세스할 수 있는 레이크하우스 및 웨어하우스와 같은 다양한 데이터 항목의 생성을 지원합니다.
Azure Data Lake Storage는 모든 데이터를 구조적 및 비정형으로 저장할 수 있는 중앙 집중식 단일 리포지토리입니다. 조직에서는 데이터 레이크를 사용하여 단일 위치에서 다양한 데이터를 빠르고 쉽게 저장하고 액세스하고 분석할 수 있습니다. 데이터 레이크를 사용하면 기존 구조에 맞게 데이터를 구성할 필요가 없습니다. 대신 데이터를 일반적으로 파일 또는 Blob(Binary Large Object)에 해당하는 원시 또는 네이티브 형식으로 저장할 수 있습니다.
Data Lake Storage Gen2는 파일 시스템 의미 체계, 파일 수준 보안 및 크기를 제공합니다. 이러한 기능은 Blob Storage를 기반으로 하므로 고가용성/재해 복구 기능을 갖춘 계층화된 저렴한 스토리지를 가져올 수도 있습니다.
Data Lake Storage Gen2는 Azure에서 Azure Storage를 엔터프라이즈 데이터 레이크를 구축하기 위한 기반으로 만듭니다. 처음부터 수백 기가비트의 처리량을 유지하면서 수 페타바이트의 정보에 대한 서비스를 제공하도록 설계된 Data Lake Storage Gen2는 방대한 양의 데이터를 쉽게 관리할 수 있습니다.
Data Factory를 사용하면 여러 데이터 원본(예: 데이터베이스, 데이터 웨어하우스, Lakehouse, 실시간 데이터 등)에서 데이터를 수집, 준비 및 변환할 수 있습니다. 워크로드를 디자인할 때 DataOps 요구 사항을 충족하는 데 중요한 역할을 할 수 있는 도구입니다.
Data Factory는 코드 및 No/low 코드 솔루션을 모두 지원합니다.
데이터 파이프라인을 사용하면 클라우드 규모에서 워크플로 기능을 만들 수 있습니다. 데이터 파이프라인을 사용하면 끌어서 놓기 인터페이스를 사용하여 데이터 흐름을 새로 고치고 페타바이트 크기의 데이터를 이동하고 제어 흐름 파이프라인을 정의할 수 있는 워크플로를 빌드할 수 있습니다.
데이터 흐름은 수백 개의 데이터 원본에서 데이터를 수집하여 300개 이상의 데이터 변환을 사용하여 데이터를 변환하기 위한 로우 코드 인터페이스를 제공합니다.
Databricks Data Intelligence Platform을 사용하면 기능 엔지니어링을 사용하여 기계 학습 워크플로를 만드는 코드를 작성할 수 있습니다.
데이터 파이프라인은 원시 데이터를 수집하고, 기능 테이블을 만들고, 모델을 학습시키고, 일괄 처리 유추를 수행합니다. Unity 카탈로그에서 기능 엔지니어링을 사용하여 모델을 학습하고 기록하는 경우 모델은 기능 메타데이터로 패키지됩니다. 일괄 처리 채점 또는 온라인 추론에 모델을 사용하면 자동으로 기능 값이 검색됩니다. 호출자는 새 데이터를 채점하기 위해 기능을 조회하거나 조인하는 논리를 포함하거나 해당 기능에 대해 알 필요가 없습니다.
모델 및 기능 서비스 엔드포인트는 한 번의 클릭으로 사용할 수 있으며 대기 시간(밀리초)을 제공합니다.
데이터 및 모델 모니터링.
Embedding을 저장하고 검색하는 데 최적화된 모자이크 AI 벡터 검색을 사용할 수도 있습니다. Embeddings는 RAG(검색 증강 생성), 권장 사항 시스템 및 이미지 인식과 같은 유사성 검색이 필요한 애플리케이션에 매우 중요합니다.
Azure Data Factory 및 Azure Synapse Analytics 파이프라인은 복사, 데이터 흐름, 조회, 메타데이터 가져오기 및 삭제 작업을 통해 많은 데이터 저장소 및 형식을 지원합니다. 사용 가능한 데이터 저장소 커넥터, 지원되는 기능 및 해당 구성 및 일반 ODBC 연결 옵션을 보려면 Azure Data Factory 및 Azure Synapse Analytics 커넥터 개요를 참조하세요.
사용자 지정 AI
Azure Machine Learning
Azure Machine Learning은 ML(Machine Learning) 프로젝트 수명 주기를 가속화하고 관리하기 위한 클라우드 서비스입니다. ML 전문가, 데이터 과학자 및 엔지니어는 일상적인 워크플로에서 이를 사용하여 모델을 학습 및 배포하고 MLOps(기계 학습 운영)를 관리할 수 있습니다.
Azure Machine Learning은 다음과 같은 기능을 제공합니다.
알고리즘 선택 일부 알고리즘은 데이터의 구조 또는 원하는 결과에 대해 특정 가정을 합니다. 사용자 요구에 적합한 것을 찾을 수 있는 경우 보다 유용한 결과, 보다 정확한 예측 또는 단축된 교육 시간을 제공할 수 있습니다.
하이퍼 매개 변수 튜닝 또는 최적화 는 최상의 성능을 제공하는 하이퍼 매개 변수의 구성을 찾는 프로세스입니다. 이 프로세스는 계산 비용이 많이 들고 수동입니다.
하이퍼 매개 변수는 모델 학습 프로세스를 제어할 수 있게 하는 조정 가능한 매개 변수입니다. 예를 들어 신경망을 사용하여 숨겨진 레이어 수와 각 레이어의 노드 수를 결정합니다. 모델 성능은 하이퍼 매개 변수에 따라 크게 달라집니다.
Azure Machine Learning을 사용하면 하이퍼 매개 변수 튜닝을 자동화하고 병렬 실험을 실행하여 하이퍼 매개 변수를 효율적으로 최적화할 수 있습니다.
모델 학습. Azure Machine Learning을 사용하면 알고리즘을 반복적으로 사용하여 모델을 만들거나 "학습"할 수 있습니다. 학습되면 이러한 모델을 사용하여 예측을 수행할 수 있는 데이터를 분석할 수 있습니다. 학습 단계에서 알려진 데이터의 품질 집합에 태그가 지정되어 개별 필드를 식별할 수 있습니다. 태그가 지정된 데이터는 특정 예측을 수행하도록 구성된 알고리즘에 제공됩니다. 완료되면 알고리즘은 찾은 패턴을 매개 변수 집합으로 설명하는 모델을 출력합니다. 유효성을 검사하는 동안 새로운 데이터에 태그가 지정되고 모델을 테스트하는 데 사용됩니다. 알고리즘은 필요에 따라 조정되며 더 많은 학습을 받을 수 있습니다. 마지막으로 테스트 단계에서는 태그나 미리 선택된 대상 없이 실제 데이터를 사용합니다. 모델의 결과가 정확하다고 가정하면 사용할 준비가 된 것으로 간주되며 배포할 수 있습니다.
AutoML(자동화된 기계 학습) 은 기계 학습 모델 개발의 시간이 오래 걸리고 반복적인 작업을 자동화하는 프로세스입니다. 프로덕션 준비 ML 모델을 얻는 데 걸리는 시간을 크게 줄일 수 있습니다. 자동화된 ML은 광범위한 프로그래밍이나 도메인 지식 없이도 모델 선택, 하이퍼 매개 변수 튜닝, 모델 학습 및 기타 작업을 지원할 수 있습니다.
Azure Machine Learning에서 지정된 대상 메트릭을 사용하여 모델을 학습하고 조정하려는 경우 자동화된 ML을 사용할 수 있습니다. 데이터 과학 전문 지식에 관계없이 자동화된 ML을 사용하여 문제에 대한 엔드 투 엔드 기계 학습 파이프라인을 식별할 수 있습니다.
업계 전반의 ML 전문가 및 개발자는 자동화된 ML을 사용하여 다음을 수행할 수 있습니다.
기능 엔지니어링 및 기능화. 학습 데이터는 행과 열로 이루어져 있습니다. 각 행은 관찰 또는 레코드이며 각 행의 열은 각 레코드를 설명하는 기능입니다. 일반적으로 데이터의 패턴을 가장 잘 특징화 하는 기능을 선택하여 예측 모델을 만듭니다.
많은 원시 데이터 필드를 직접 사용하여 모델을 학습할 수 있지만 데이터 패턴을 더 잘 구분하는 정보를 제공하는 다른 (엔지니어링된) 기능을 만들어야 하는 경우가 많습니다. 이 프로세스를 기능 엔지니어링이라고 하며 이를 통해 데이터의 도메인 지식을 사용하여 기계 학습 알고리즘이 더 잘 학습하게 하는 기능을 만듭니다.
Azure Machine Learning에서는 데이터 크기 조정 및 정규화 기술이 적용되어 기능 엔지니어링이 더 쉬워집니다. 이러한 기술과 이 기능 엔지니어링은 자동화된 ML(기계 학습) 실험에서 기능화라고 통칭합니다.
Azure AI 서비스는 사용자 지정 AI 모델 및 애플리케이션을 빌드할 수 있는 기능을 제공합니다. 이 섹션에서는 이러한 주요 기능 중 일부를 간략하게 제공합니다.
Custom Speech
사용자 지정 음성 은 Azure AI Speech Service의 기능입니다. 사용자 지정 음성을 사용하면 애플리케이션 및 제품에 대한 음성 인식의 정확도를 평가하고 개선할 수 있습니다. 사용자 지정 음성 모델은 실시간 음성 텍스트 변환, 음성 번역 및 일괄 처리 대화 기록에 사용할 수 있습니다.
기본적으로 음성 인식은 유니버설 언어 모델을 Microsoft 소유의 데이터로 학습하고 일반적으로 사용되는 음성 언어를 반영하는 기본 모델로 활용합니다. 기본 모델은 다양한 공통 도메인을 나타내는 방언 및 음성학으로 미리 학습됩니다. 음성 인식을 요청하면 기본적으로 각 지원되는 언어에 대한 최신 기본 모델이 사용됩니다. 기본 모델은 대부분의 음성 인식 시나리오에서 잘 작동합니다.
사용자 지정 모델을 사용하면 모델을 학습시키는 텍스트 데이터를 제공함으로써 기본 모델을 보강하여 애플리케이션과 관련된 도메인별 어휘의 인지를 개선할 수 있습니다. 또한 오디오 데이터에 참조 전사를 제공하여 애플리케이션의 특정 오디오 조건에 따른 인지를 개선하는 데 사용할 수 있습니다.
또한 데이터가 패턴을 따르는 경우 구조화된 텍스트로 모델을 학습하여 사용자 지정 발음을 지정하고 사용자 지정 역 텍스트 정규화, 사용자 지정 재작성 및 사용자 지정 욕설 필터링을 통해 표시 텍스트 서식을 사용자 지정할 수 있습니다.
Custom Translator
Custom Translator 는 Azure AI Translator 서비스의 기능 입니다 . Custom Translator를 사용하면 엔터프라이즈, 앱 개발자 및 언어 서비스 공급자가 사용자 지정된 NMT(신경망 기계 번역) 시스템을 빌드할 수 있습니다. 사용자 지정된 번역 시스템은 중단 없이 기존 애플리케이션, 워크플로 및 웹 사이트에 통합됩니다.
플랫폼을 통해 사용자는 영어 간 사용자 지정 번역 시스템을 빌드하고 게시할 수 있습니다. Custom Translator는 36개가 넘는 언어를 지원하며, NMT에 제공되는 언어에 직접 매핑됩니다. 전체 목록은 Translator 언어 지원을 참조하세요.
언제든지 Microsoft Translator Text API V3를 통해 기존 애플리케이션/프로그램에서 사용자 지정 번역 모델에 액세스할 수 있습니다.
문서 인텔리전스 사용자 지정 모델
Azure AI Document Intelligence 는 고급 기계 학습 기술을 사용하여 문서를 식별하고, 양식 및 문서에서 정보를 검색 및 추출하고, 추출된 데이터를 구조화된 JSON 출력으로 반환합니다. 문서 인텔리전스를 사용하면 문서 분석 모델, 미리 빌드/미리 학습된 모델 또는 학습된 독립 실행형 사용자 지정 모델을 사용할 수 있습니다.
이제 문서 인텔리전스 사용자 지정 모델에 는 추출 모델을 호출하기 전에 문서 유형을 식별해야 하는 시나리오에 대한 사용자 지정 분류 모델이 포함됩니다. 분류 모델을 사용자 지정 추출 모델과 페어링하여 비즈니스와 관련된 양식 및 문서에서 필드를 분석하고 추출할 수 있습니다. 독립 실행형 사용자 지정 추출 모델을 결합하여 구성된 모델을 만들 수 있습니다.
사용자 지정 AI 도구
미리 빌드된 AI 모델은 유용하고 점점 더 유연해지지만 AI에서 필요한 것을 얻는 가장 좋은 방법은 특정 요구 사항에 맞는 모델을 빌드하는 것입니다. 사용자 지정 AI 모델을 만들기 위한 두 가지 기본 도구인 생성 AI와 기존 기계 학습이 있습니다.
Azure Machine Learning 스튜디오
Azure Machine Learning 스튜디오 ML(기계 학습) 프로젝트 수명 주기를 가속화하고 관리하기 위한 클라우드 서비스입니다. ML 전문가, 데이터 과학자 및 엔지니어는 일상적인 워크플로에서 이를 사용하여 모델을 학습 및 배포하고 MLOps(기계 학습 작업)를 관리할 수 있습니다.
클라우드 규모의 대규모 AI 워크로드를 위한 Spark 및 GPU 등 모든 유형의 컴퓨팅으로 Azure Machine Learning 모델을 빌드하고 학습시킵니다.
로우코드 Azure Machine Learning에 대해 자동 Azure Machine Learning(AutoML) 및 끌어서 놓기 UI를 실행합니다.
엔드투엔드 Azure Machine LearningOps 및 반복 가능한 Azure Machine Learning 파이프라인을 구현합니다.
바이어스 검색 및 오류 분석에 책임 있는 AI 대시보드를 사용합니다.
프롬프트 엔지니어링 및 LLM 흐름을 오케스트레이션하고 관리합니다.
REST API 엔드포인트, 실시간 및 일괄 처리 유추를 사용하여 모델을 배포합니다.
허브(미리 보기)를 사용하여 IT 거버넌스를 중앙 집중화하면서 작업 영역 그룹과 회사 리소스에 대한 컴퓨팅, 할당량, 보안 및 연결을 공유합니다. 허브를 한 번 설정한 다음 각 프로젝트에 대한 Studio에서 직접 보안 작업 영역을 만듭니다. 허브를 사용하여 ML Studio 및 Azure AI Foundry 포털에서 팀의 작업을 관리합니다.
Azure AI 연구소
Azure AI Foundry Azure 광범위한 AI 제품의 기능을 통해 사용자 지정 생성 AI 애플리케이션을 효율적으로 빌드하고 배포할 수 있도록 설계되었습니다.
하나의 팀으로 함께 빌드합니다. Azure AI Foundry 허브는 엔터프라이즈급 보안과 미리 학습된 모델, 데이터 및 컴퓨팅에 대한 공유 리소스 및 연결이 있는 공동 작업 환경을 제공합니다.
원하는 대로 구성합니다. Azure AI Foundry 프로젝트를 사용하면 상태를 저장하여 첫 번째 아이디어에서 첫 번째 프로토타입, 첫 번째 프로덕션 배포까지 반복할 수 있습니다. 또한 이 여정을 따라 공동 작업할 수 있게 하도록 다른 사용자를 쉽게 초대할 수 있습니다.
GitHub, Visual Studio Code, LangChain, 의미 체계 커널, AutoGen 등 선호하는 개발 플랫폼과 프레임워크를 사용합니다.
1,600개 이상의 모델을 살펴보고 벤치마킹합니다.
서버리스 API 및 호스트된 미세 조정을 통해 MaaS(Model-as-a-Service)를 프로비전합니다.
여러 모델, 데이터 원본 및 형식을 통합합니다.
미세 조정할 필요 없이 보호된 엔터프라이즈 데이터를 사용하여 RAG(검색 증강 세대)를 빌드합니다.
프롬프트 엔지니어링 및 LLM(대규모 언어 모델) 흐름을 오케스트레이션하고 관리합니다.
구성 가능한 필터와 제어 기능으로 앱과 API를 설계하고 보호합니다.
기본 제공 및 사용자 지정 평가 흐름을 사용하여 모델 응답을 평가합니다.
환경 전반에서 지속적인 모니터링 및 거버넌스를 통해 Azure 관리형 인프라에 AI 혁신을 배포합니다.
프로덕션 환경에서 안전, 품질 및 토큰 사용을 위해 배포된 앱을 지속적으로 모니터링합니다.|
Azure AI Foundry 포털의 프롬프트 흐름은 LLM(대규모 언어 모델) 기반 AI 애플리케이션의 전체 개발 주기를 간소화하도록 설계된 개발 도구입니다. 프롬프트 흐름은 AI 애플리케이션의 프로토타입 제작, 실험, 반복 및 배포 프로세스를 간소화하는 포괄적인 솔루션을 제공합니다.
프롬프트 흐름은 흐름을 생성, 사용자 지정 또는 실행하는 데 사용할 수 있는 기능입니다.
흐름은 AI 논리를 구현할 수 있는 실행 가능한 명령 집합입니다. 흐름은 미리 빌드된 캔버스, LangChain 등과 같은 여러 도구를 통해 만들거나 실행할 수 있습니다. 흐름의 반복은 자산으로 저장할 수 있으며, 배포되면 흐름이 API가 됩니다. 모든 흐름이 프롬프트 흐름은 아닙니다. 오히려 프롬프트 흐름은 흐름을 만드는 한 가지 방법입니다.
프롬프트는 사용자 입력, 시스템 메시지 및 예제로 구성된 모델로 전송되는 입력 패키지입니다. 사용자 입력은 채팅 창에 제출되는 텍스트입니다. 시스템 메시지는 그 동작과 기능의 범위를 지정하는 모델에 대한 지침 세트입니다.
샘플 흐름은 흐름의 작동 방식을 보여 줍니다. 미리 빌드된 간단한 오케스트레이션 흐름이며, 사용자 지정할 수 있습니다.
샘플 프롬프트는 특정 시나리오에 대해 정의된 프롬프트로, 라이브러리에서 복사하고 프롬프트 디자인에서 있는 그대로 사용하거나 수정할 수 있습니다.
사용자 지정 AI 코드 언어
AI의 핵심 개념은 알고리즘을 사용하여 데이터를 분석하고 유용한 방식으로 데이터를 설명(또는 채점)하는 모델을 생성하는 것입니다. 알고리즘은 프로그래밍 코드를 사용하여 개발자와 데이터 과학자(때로는 다른 알고리즘)가 작성합니다. AI 개발에 가장 널리 사용되는 프로그래밍 언어 중 두 가지는 현재 Python과 R입니다.
Python은 범용 고급 프로그래밍 언어입니다. 가독성을 강조하는 간단하고 알아보기 쉬운 구문이 있습니다. 컴파일 단계가 없습니다. Python에는 대규모 표준 라이브러리가 있지만 모듈 및 패키지를 추가하는 기능도 지원합니다. 이를 통해 모듈화를 장려하고 필요할 때 기능을 확장할 수 있습니다. Azure에서 쉽게 사용할 수 있는 많은 것을 포함하여 Python용 AI 및 ML 라이브러리의 대규모 에코시스템이 성장하고 있습니다.