기계 학습을 위한 데이터 과학의 기초

초급
중급
AI 엔지니어
데이터 과학자
개발자
학생
Azure

Microsoft Learn은 클래식 기계 학습을 소개하는 몇 가지 대화형 방법을 제공합니다. 이러한 학습 경로는 자체적으로 생산성 개선에 도움을 주며 딥 러닝 토픽으로 전환할 수 있는 유용한 토대가 됩니다.

가장 기본적인 클래식 기계 학습 모델부터 예비 데이터 분석 및 아키텍처 사용자 지정에 이르기까지, 브라우저를 벗어나지 않고도 개념 콘텐츠와 대화형 Jupyter Notebook을 쉽게 다이제스트하는 방법을 익힐 수 있습니다.

교육 배경 및 관심에 따라 자신만의 적절한 경로를 선택합니다.

✔ 옵션 1: 전체 과정: 기계 학습을 위한 데이터 과학의 기초

대부분의 사용자에게 권장되는 옵션입니다. 개념 강화를 최대화하는 사용자 지정 흐름이 있는 다른 두 학습 경로와 동일한 모듈을 제공합니다. 기본 개념과 가장 일반적인 기계 학습 도구를 사용하여 모델을 빌드하는 방법을 알아보려면 이 경로가 적합합니다. 또한 클래식 기계 학습을 넘어 딥 러닝 및 신경망(여기서는 소개만 함)에 대한 교육을 받으려는 경우 가장 좋은 경로입니다.

✔ 현재 이 경로에 있으며 시작하려면 아래로 스크롤합니다.

옵션 2: 기계 학습을 위한 데이터 과학 이해 학습 경로

기계 학습의 작동 방식을 이해하려고 하며 수학적 배경 지식이 많지 않은 경우 이 경로가 적합합니다. 이전에 어떤 교육을 받았는지는 고려하지 않으며(단, 코딩 개념을 어느 정도 알고 있어야 함) 이해에 도움이 되는 코드, 메타포 및 시각적 개체를 알아봅니다. 실습이지만 기본 사항 이해에 좀 더 중점을 두고 사용 가능한 도구 및 라이브러리는 자세히 다루지 않습니다.

옵션 3: 기계 학습 모델 만들기 학습 경로

기계 학습 개념을 이미 알고 있거나 강력한 수학 배경 지식이 있는 경우 기계 학습 모델 만들기 학습 경로로 바로 이동하는 것이 좋습니다. 이러한 모듈은 몇 가지 기계 학습 개념을 다루지만 scikit-learn, TensorFlow 및 PyTorch와 같은 도구를 사용할 수 있도록 빠르게 진행됩니다. 이 학습 경로는 Azure ML 또는 Azure Databricks와 같은 제품에 대한 기계 학습 예제를 충분히 이해할 수 있는 배경 지식을 원하는 경우에 가장 적합합니다.

사전 요구 사항

없음

이 학습 경로의 모듈

컴퓨터 과학 및 통계에 대한 지식이 거의 없는 사람들을 위한 개략적인 기계 학습 개요입니다. 여기에서는 몇 가지 기본 개념을 학습하고 데이터를 살펴보고, Python을 사용하여 기계 학습의 수명 주기를 대화식으로 학습하고, 실제 세계에서 만나볼 수 있는 기계 학습 모델을 학습, 저장, 사용해볼 수 있습니다.

감독 학습은 알고리즘이 예시 데이터로부터 학습을 수행하는 일종의 기계 학습입니다. 여기에서는 감독 학습이 실제 세계에 대해 예측을 수행할 수 있는 모델을 어떻게 자동으로 생성하는지에 대해 하나씩 차근히 살펴보겠습니다. 또한 이러한 모델을 테스트하는 방법과 학습 중 발생 가능한 문제에 대해서도 살펴봅니다.

기계 학습 모델의 강력한 점은 모델을 학습시키는 데 사용되는 데이터에서 비롯됩니다. 콘텐츠와 연습을 통해 데이터를 이해하는 방법, 컴퓨터가 올바르게 해석할 수 있도록 데이터를 인코딩하는 방법, 오류를 정리하는 방법, 고성능 모델을 만드는 데 도움이 되는 팁을 살펴봅니다.

데이터 탐색 및 분석은 데이터 과학의 핵심입니다. 데이터 과학자는 데이터를 탐색하고 시각화하며 조작하기 위해 Python과 같은 프로그래밍 언어를 다루는 기술을 필요로 합니다.

회귀는 가장 널리 사용되는 기계 학습 기술이며, 일반적으로 과학적 발견, 비즈니스 계획, 주식 시장 분석을 기본으로 합니다. 이 학습 자료는 간단하고 복잡한 몇 가지 일반적인 회귀 분석을 자세히 알아보고, 모델 성능을 평가하는 방법에 대한 인사이트를 제공합니다.

기계 학습을 생각할 때 학습 프로세스에 집중하는 경우가 많습니다. 이 프로세스를 수행하기 전에, 약간의 준비를 통해 학습 속도를 높이고 학습을 향상시킬 수 있을 뿐만 아니라, 이전에 확인되지 않은 데이터에 직면했을 때 모델의 작동 방식에 대한 확신도 얻을 수 있습니다.

회귀는 숫자 값을 예측하기 위해 일반적으로 사용되는 유형의 기계 학습입니다.

분류는 항목을 범주에 할당하는 것을 의미하거나 자동화된 의사 결정이라고 할 수 있습니다. 여기서는 로지스틱 회귀를 통해 분류 모델을 도입하여 더 복잡하고 흥미로운 분류 방법에 대해 알아봅니다.

효율성을 향상하기 위해 좀 더 복잡한 모델을 수동으로 사용자 지정할 수 있습니다. 연습 및 설명 콘텐츠를 통해 더 복잡한 모델의 아키텍처를 변경하여 더욱 효과적인 결과를 가져올 수 있는 방법을 알아봅니다.

모델의 데이터 분류에 문제가 있는지 어떻게 알 수 있나요? 컴퓨터에서 모델 성능을 평가하는 방식은 종종 이해하기 어렵거나 모델이 실제로 동작하는 방식을 너무 간소화할 수 있습니다. 만족스러운 방식으로 작동하는 모델을 빌드하려면 이를 평가하는 직관적인 방법을 찾고 이러한 메트릭이 뷰를 편향하는 방식을 이해해야 합니다.

수신기 연산자 특성 곡선은 학습 분류 모델을 평가하고 미세 조정하기 위한 강력한 방법입니다. 여기에서는 학습 콘텐츠와 실제 연습을 통해 이러한 곡선의 유용성을 소개하고 자세히 설명합니다.

분류는 항목을 클래스로 분류하는 데 사용되는 기계 학습의 일종입니다.

클러스터링은 유사한 항목을 클러스터로 그룹화하는 데 사용되는 기계 학습의 한 형태입니다.

딥 러닝은 인간 두뇌가 연결된 신경세포망을 통해 학습하는 방식을 에뮬레이트하는 고급 형태의 기계 학습입니다.