적절한 컴퓨팅 대상 선택

7분

Azure Machine Learning에서 컴퓨팅 대상은 작업을 실행하는 물리적 또는 가상 컴퓨터입니다.

사용 가능한 컴퓨팅 유형 이해

Azure Machine Learning은 실험, 학습 및 배포를 위한 여러 형식의 컴퓨팅을 지원합니다. 여러 유형의 컴퓨팅을 사용하면 요구 사항에 가장 적합한 컴퓨팅 대상 유형을 선택할 수 있습니다.

Diagram of different hyperparameter values resulting in different models by performing hyperparameter tuning.

컴퓨팅 인스턴스: 가상 머신과 유사하게 동작하며 주로 Notebook을 실행하는 데 사용됩니다. 실험에 이상적입니다.
컴퓨팅 클러스터: 수요에 맞게 자동으로 스케일 업 또는 다운되는 가상 머신의 다중 노드 클러스터입니다. 대량의 데이터를 처리해야 하는 스크립트를 실행하는 비용 효율적인 방법입니다. 또한 클러스터를 사용하면 병렬 처리를 사용하여 워크로드를 분산하고 스크립트를 실행하는 데 걸리는 시간을 단축할 수 있습니다.
Kubernetes 클러스터: Kubernetes 기술을 기반으로 하는 클러스터로, 컴퓨팅을 구성하고 관리하는 방법을 보다 세분화할 수 있습니다. 클라우드 컴퓨팅용 AKS(자체 관리형 Azure Kubernetes) 클러스터 또는 온-프레미스 워크로드용 Arc Kubernetes 클러스터를 연결할 수 있습니다.
연결된 컴퓨팅: Azure 가상 머신 또는 Azure Databricks 클러스터와 같은 기존 컴퓨팅을 작업 영역에 연결할 수 있습니다.
서버리스 컴퓨팅: 학습 작업에 사용할 수 있는 완전 관리형 주문형 컴퓨팅입니다.

참고 항목

Azure Machine Learning은 사용자 고유의 컴퓨팅을 만들고 관리하거나 Azure Machine Learning에서 완전히 관리되는 컴퓨팅을 사용하는 옵션을 제공합니다.

언제 어떤 유형의 컴퓨팅을 사용해야 할까요?

일반적으로 컴퓨팅 대상을 사용할 때 따를 수 있는 몇 가지 모범 사례가 있습니다. 적절한 유형의 컴퓨팅을 선택하는 방법을 이해하기 위해 몇 가지 예제가 제공됩니다. 사용하는 컴퓨팅 유형은 항상 구체적인 상황에 따라 달라집니다.

실험을 위한 컴퓨팅 대상 선택

데이터 과학자이고 새로운 기계 학습 모델을 개발하라는 요청을 받고 있다고 상상해 보십시오. 실험할 수 있는 학습 데이터의 작은 하위 집합이 있을 수 있습니다.

실험 및 개발 중에는 Jupyter Notebook에서 작업하는 것이 좋습니다. Notebook 환경은 지속적으로 실행되는 컴퓨팅을 가장 잘 활용합니다.

많은 데이터 과학자는 로컬 디바이스에서 Notebook을 실행하는 데 익숙합니다. Azure Machine Learning에서 관리하는 클라우드 대안은 컴퓨팅 인스턴스입니다. 또는 Spark의 분산 컴퓨팅 기능을 사용하려는 경우 Spark 서버리스 컴퓨팅을 선택하여 Notebook에서 Spark 코드를 실행할 수도 있습니다.

프로덕션을 위한 컴퓨팅 대상 선택

실험 후에는 Python 스크립트를 실행하여 프로덕션을 준비하여 모델을 학습시킬 수 있습니다. 시간이 지나면 모델을 지속적으로 재학습하려는 경우 스크립트를 자동화하고 예약하기가 더 쉬워질 것입니다. 스크립트를 (파이프라인) 작업으로 실행할 수 있습니다.

프로덕션으로 전환할 때 여러분은 컴퓨팅 대상이 대량의 데이터를 처리할 준비가 되도록 하고 싶습니다. 더 많은 데이터를 사용할수록 기계 학습 모델이 더 나아질 수 있습니다.

스크립트를 사용하여 모델을 학습할 때 주문형 컴퓨팅 대상을 원합니다. 컴퓨팅 클러스터는 스크립트를 실행해야 할 때 자동으로 확장되고 스크립트 실행이 완료되면 축소됩니다. 만들고 관리할 필요가 없는 대안을 원하는 경우 Azure Machine Learning의 서버리스 컴퓨팅을 사용할 수 있습니다.

배포를 위한 컴퓨팅 대상 선택

모델을 사용하여 예측을 생성하는 데 필요한 컴퓨팅 유형은 일괄 처리 또는 실시간 예측을 원하는지에 따라 달라집니다.

일괄 처리 예측의 경우 Azure Machine Learning에서 파이프라인 작업을 실행할 수 있습니다. 컴퓨팅 클러스터 및 Azure Machine Learning의 서버리스 컴퓨팅과 같은 컴퓨팅 대상은 주문형이며 확장성이 뛰어난 파이프라인 작업에 적합합니다.

실시간 예측을 원하는 경우 지속적으로 실행되는 컴퓨팅 유형이 필요합니다. 따라서 실시간 배포는 더 가볍고 비용 효율적인 컴퓨팅의 이점을 누릴 수 있습니다. 컨테이너는 실시간 배포에 적합합니다. 모델을 관리형 온라인 엔드포인트에 배포할 때 Azure Machine Learning은 모델을 실행할 컨테이너를 만들고 관리합니다. 또는 Kubernetes 클러스터를 연결하여 실시간 예측을 생성하는 데 필요한 컴퓨팅을 관리할 수 있습니다.

계속

사용 가능한 컴퓨팅 유형 이해

언제 어떤 유형의 컴퓨팅을 사용해야 할까요?

실험을 위한 컴퓨팅 대상 선택

프로덕션을 위한 컴퓨팅 대상 선택

배포를 위한 컴퓨팅 대상 선택

피드백