다음을 통해 공유


Microsoft 로지스틱 회귀 알고리즘

로지스틱 회귀는 이진 결과를 모델링하는 데 사용되는 잘 알려진 통계 기술입니다.

다양한 학습 기술을 사용하여 통계 연구에서 로지스틱 회귀의 다양한 구현이 있습니다. Microsoft 로지스틱 회귀 알고리즘은 Microsoft 신경망 알고리즘의 변형을 사용하여 구현되었습니다. 이 알고리즘은 신경망의 많은 특성을 공유하지만 학습이 더 쉽습니다.

로지스틱 회귀의 한 가지 장점은 알고리즘이 매우 유연하고 모든 종류의 입력을 취하며 여러 가지 분석 작업을 지원한다는 것입니다.

  • 인구 통계를 사용하여 특정 질병의 위험과 같은 결과에 대한 예측을 수행합니다.

  • 결과에 기여하는 요인을 탐색하고 가중치를 지정합니다. 예를 들어 고객이 매장을 반복적으로 방문하는 데 영향을 주는 요소를 찾습니다.

  • 많은 특성이 있는 문서, 전자 메일 또는 기타 개체를 분류합니다.

예시

유사한 인구 통계 정보를 공유하고 Adventure Works 회사에서 제품을 구매하는 사람들의 그룹을 고려해 보세요. 대상 제품 구매와 같은 특정 결과와 관련된 데이터를 모델링하면 인구 통계 정보가 대상 제품을 구매할 가능성에 어떻게 기여하는지 확인할 수 있습니다.

알고리즘 작동 방식

로지스틱 회귀는 결과 쌍에 대한 여러 요인의 기여를 결정하는 잘 알려진 통계 방법입니다. Microsoft 구현에서는 수정된 신경망을 사용하여 입력과 출력 간의 관계를 모델링합니다. 출력에 대한 각 입력의 효과를 측정하고 다양한 입력이 완성된 모델에서 가중치를 적용합니다. 이름 로지스틱 회귀는 극단적인 값의 효과를 최소화하기 위해 로지스틱 변환을 사용하여 데이터 곡선을 압축한다는 사실에서 비롯됩니다. 구현 및 알고리즘을 사용자 지정하는 방법에 대한 자세한 내용은 Microsoft 로지스틱 회귀 알고리즘 기술 참조를 참조하세요.

로지스틱 회귀 모델에 필요한 데이터

로지스틱 회귀 모델 학습에 사용할 데이터를 준비할 때 필요한 데이터의 양과 데이터 사용 방법을 포함하여 특정 알고리즘에 대한 요구 사항을 이해해야 합니다.

로지스틱 회귀 모델에 대한 요구 사항은 다음과 같습니다.

단일 키 열 각 모델에는 각 레코드를 고유하게 식별하는 하나의 숫자 또는 텍스트 열이 포함되어야 합니다. 복합 키는 허용되지 않습니다.

입력 열 각 모델에는 분석의 요소로 사용되는 값이 포함된 하나 이상의 입력 열이 포함되어야 합니다. 입력 열을 원하는 만큼 많이 사용할 수 있지만 각 열의 값 수에 따라 추가 열을 추가하면 모델을 학습하는 데 걸리는 시간이 늘어나게 됩니다.

하나 이상의 예측 가능한 열 모델에는 연속 숫자 데이터를 포함하여 데이터 형식의 예측 가능한 열이 하나 이상 포함되어야 합니다. 예측 가능한 열의 값은 모델에 대한 입력으로 처리되거나 예측에만 사용하도록 지정할 수 있습니다. 중첩 테이블은 예측 가능한 열에는 허용되지 않지만 입력으로 사용할 수 있습니다.

로지스틱 회귀 모델에 지원되는 콘텐츠 형식 및 데이터 형식에 대한 자세한 내용은 Microsoft 로지스틱 회귀 알고리즘 기술 참조의 요구 사항 섹션을 참조하세요.

로지스틱 회귀 모델 보기

모델을 탐색하려면 Microsoft 신경망 뷰어 또는 Microsoft 일반 콘텐츠 트리 뷰어를 사용할 수 있습니다.

Microsoft 신경망 뷰어를 사용하여 모델을 볼 때 Analysis Services는 중요도에 따라 순위가 지정된 특정 결과에 기여하는 요소를 보여 줍니다. 비교할 특성과 값을 선택할 수 있습니다. 자세한 내용은 Microsoft 신경망 뷰어를 사용하여 모델 찾아보기를 참조하세요.

자세히 알아보려면 Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 모델 세부 정보를 찾아볼 수 있습니다. 로지스틱 회귀 모델의 모델 콘텐츠에는 모델에 사용되는 모든 입력을 보여 주는 한계 노드와 예측 가능한 특성에 대한 서브네트워크가 포함됩니다. 자세한 내용은 로지스틱 회귀 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.

예측 만들기

모델을 학습한 후에는 모델 콘텐츠에 대한 쿼리를 만들어 회귀 계수 및 기타 세부 정보를 얻거나 모델을 사용하여 예측을 수행할 수 있습니다.

비고

  • 드릴스루(데이터 심층 분석)를 지원하지 않습니다. 마이닝 모델의 노드 구조가 반드시 기본 데이터에 직접 해당하는 것은 아니기 때문입니다.

  • 데이터 마이닝 차원의 생성을 지원하지 않습니다.

  • OLAP 마이닝 모델의 사용을 지원합니다.

  • PMML(예측 모델 태그 언어)을 사용하여 마이닝 모델을 만드는 것은 지원되지 않습니다.

또한 참조하십시오

로지스틱 회귀 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)
Microsoft 로지스틱 회귀 알고리즘 기술 참조
로지스틱 회귀 모델 쿼리 예제