다음을 통해 공유


Azure SQL Database에서 가져오기

중요

Machine Learning Studio(클래식)에 대한 지원은 2024년 8월 31일에 종료됩니다. 해당 날짜까지 Azure Machine Learning으로 전환하는 것이 좋습니다.

2021년 12월 1일부터 새로운 Machine Learning Studio(클래식) 리소스를 만들 수 없습니다. 2024년 8월 31일까지는 기존 Machine Learning Studio(클래식) 리소스를 계속 사용할 수 있습니다.

ML Studio(클래식) 설명서는 사용 중지되며 나중에 업데이트되지 않을 수 있습니다.

이 문서에서는 Machine Learning Studio(클래식)에서 데이터 가져오기 모듈을 사용하여 Azure SQL Database 또는 Azure SQL Data Warehouse 데이터를 가져오는 방법을 설명합니다.

참고

적용 대상: Machine Learning Studio(클래식)

유사한 끌어서 놓기 모듈은 Azure Machine Learning 디자이너에서 사용할 수 있습니다.

데이터베이스에서 데이터를 가져오려면 서버 이름과 데이터베이스 이름 및 테이블, 뷰 또는 쿼리를 정의하는 SQL 문을 모두 지정해야 합니다.

일반적으로 Azure 데이터베이스에 데이터를 저장하는 것은 Azure에서 테이블 또는 Blob을 사용하는 것보다 비용이 더 많이 듭니다. 구독 유형에 따라 데이터베이스에 저장할 수 있는 데이터의 양에 제한이 있을 수도 있습니다. 그러나 SQL Azure Database에 대한 트랜잭션 수수료는 없으므로 이 옵션은 데이터 조회 테이블 또는 데이터 사전과 같이 자주 사용되는 더 적은 양의 정보에 빠르게 액세스하는 데 적합합니다.

데이터를 읽기 전에 필터링할 수 있어야 하거나 보고용으로 예측 또는 메트릭을 데이터베이스에 다시 저장하려는 경우에도 Azure 데이터베이스에 데이터를 저장하는 것이 좋습니다.

Azure SQL Database 또는 SQL Data Warehouse 데이터를 가져오는 방법

데이터 가져오기 마법사 사용

이 모듈에는 스토리지 옵션을 선택하고, 기존 구독 및 계정 중에서 선택하고, 모든 옵션을 신속하게 구성하는 데 도움이 되는 새 마법사가 있습니다.

  1. 데이터 가져오기 모듈을 실험에 추가합니다. 데이터 입력 및 출력 범주의 Studio(클래식)에서 모듈을 찾을 수 있습니다.

  2. 데이터 가져오기 마법사 시작을 클릭하고 프롬프트를 따릅니다.

  3. 구성이 완료되면 실제로 데이터를 실험에 복사하려면 모듈을 마우스 오른쪽 단추로 클릭하고 선택한 실행을 선택합니다.

기존 데이터 연결을 편집해야 하는 경우 마법사는 처음부터 다시 시작할 필요가 없도록 모든 이전 구성 세부 정보를 로드합니다.

데이터 가져오기 모듈에서 수동으로 속성 설정

다음 단계에서는 가져오기 원본을 수동으로 구성하는 방법을 설명합니다.

  1. 데이터 가져오기 모듈을 실험에 추가합니다. 이 모듈은 Studio(클래식)의 데이터 입력 및 출력 범주에서 찾을 수 있습니다.

  2. 데이터 원본의 경우 Azure SQL Database 선택합니다.

  3. Azure SQL Database 또는 Azure SQL Data Warehouse 관련된 다음 옵션을 설정합니다.

    데이터베이스 서버 이름: Azure에서 생성된 서버 이름을 입력합니다. 일반적으로 <generated_identifier>.database.windows.net 형식을 사용합니다.

    데이터베이스 이름: 방금 지정한 서버에 있는 기존 데이터베이스의 이름을 입력합니다.

    서버 사용자 계정 이름: 데이터베이스에 대한 액세스 권한이 있는 계정의 사용자 이름을 입력합니다.

    서버 사용자 계정 암호: 지정된 사용자 계정에 대한 암호를 제공합니다.

    데이터베이스 쿼리: 읽으려는 데이터를 설명하는 SQL 문을 입력하거나 붙여넣습니다. 항상 SQL 문의 유효성을 검사하고 Visual Studio 서버 탐색기 또는 SQL Server Data Tools 같은 도구를 사용하여 쿼리 결과를 미리 확인합니다.

    참고

    데이터 가져오기 모듈은 데이터베이스 이름, 사용자 계정 이름 및 암호를 자격 증명으로 입력하는 것만 지원합니다.

  4. Machine Learning 읽은 데이터 세트가 실험 실행 간에 변경되지 않는 경우 캐시된 결과 사용 옵션을 선택합니다.

    이 옵션을 선택하면 모듈 매개 변수에 대한 다른 변경 내용이 없는 경우 실험은 모듈을 처음 실행할 때 데이터를 로드하고, 그 후에는 캐시된 버전의 데이터 세트를 사용합니다.

    실험의 각 반복에서 데이터 세트를 다시 로드하려면 이 옵션을 선택 취소합니다. 데이터 가져오기에서 매개 변수가 변경될 때마다 데이터 세트가 원본에서 다시 로드됩니다.

  5. 실험을 실행합니다.

    데이터 가져오기가 스튜디오(클래식)로 데이터를 로드할 때 원본 데이터베이스에 사용되는 데이터 형식에 따라 일부 암시적 형식 변환이 수행될 수도 있습니다.

결과

가져오기가 완료되면 출력 데이터 세트를 클릭하고 시각화 를 선택하여 데이터를 성공적으로 가져왔는지 확인합니다.

필요에 따라 Studio(클래식)의 도구를 사용하여 데이터 세트 및 해당 메타데이터를 변경할 수 있습니다.

기계 학습에서 Azure 데이터베이스의 데이터를 사용하는 방법에 대한 예제는 다음 문서 및 실험을 참조하세요.

기술 정보

이 섹션에는 구현 세부 정보, 팁, 자주 묻는 질문에 대한 답변이 포함되어 있습니다.

일반적인 질문

원본에서 읽는 데이터를 필터링할 수 있나요?

데이터 가져오기 모듈은 데이터를 읽는 동안 필터링을 지원하지 않습니다. 뷰를 만들거나 필요한 행만 생성하는 쿼리를 정의하는 것이 좋습니다.

참고

필요 이상으로 많은 데이터를 로드한 경우 새 데이터 집합을 읽은 다음 더 오래되고 크기가 큰 데이터와 같은 이름으로 저장하여 캐시된 데이터 집합을 덮어쓸 수 있습니다.

"10진수 형식은 지원되지 않습니다"라는 오류가 표시되는 이유는 무엇인가요?

SQL 데이터베이스에서 데이터를 읽을 때 지원되지 않는 데이터 형식을 보고하는 오류 메시지가 발생할 수 있습니다.

SQL 데이터베이스에서 가져오는 데이터에 Machine Learning 지원되지 않는 데이터 형식이 포함된 경우 데이터를 읽기 전에 소수 자릿수를 지원되는 데이터로 캐스팅하거나 변환해야 합니다. 데이터 가져오기 는 정밀도가 손실되는 변환을 자동으로 수행할 수 없습니다.

지원되는 데이터 형식에 대한 자세한 내용은 모듈 데이터 형식을 참조하세요.

데이터베이스가 다른 지역에 있는 경우 어떻게 되나요? 데이터 가져오기가 데이터베이스에 계속 액세스할 수 있나요? 데이터는 어디에 저장되나요?

데이터베이스가 기계 학습 계정과 다른 지역에 있는 경우 데이터 액세스 속도가 느려질 수 있습니다. 또한 컴퓨팅 노드가 스토리지 계정과 다른 지역에 있는 경우 구독의 데이터 수신 및 송신 요금이 청구됩니다.

실험을 위해 작업 영역으로 읽은 데이터는 실험과 연결된 스토리지 계정에 저장됩니다.

일부 문자가 올바르게 표시되지 않는 이유는 무엇인가요?

Machine Learning UTF-8 인코딩을 지원합니다. 데이터베이스의 문자열 열이 다른 인코딩을 사용하는 경우 문자를 올바르게 가져오지 못할 수 있습니다.

한 가지 옵션은 Azure Storage의 CSV 파일로 데이터를 내보내고 인 코딩과 함께 CSV 옵션을 사용하여 사용자 지정 구분 기호, 코드 페이지 등에 대한 매개 변수를 지정하는 것입니다.

모듈 매개 변수

Name 범위 Type 기본값 설명
데이터 원본 목록 데이터 원본 또는 싱크 Azure Blob Storage 데이터 원본은 HTTP, FTP, 익명 HTTPS 또는 FTPS, Azure BLOB Storage의 파일, Azure 테이블, Azure SQL Database, 온-프레미스 SQL Server 데이터베이스, Hive 테이블 또는 OData 엔드포인트일 수 있습니다.
HDFS 서버 URI any String 없음 HDFS rest 엔드포인트
데이터베이스 서버 이름 any String 없음 Azure Storage 계정 이름
데이터베이스 이름 any SecureString 없음 Azure Storage 키
서버 사용자 계정 이름 any String 없음 Azure 컨테이너 이름
서버 사용자 계정 이름 목록(하위 집합) URL 내용 OData 데이터 형식 유형
데이터베이스 쿼리 any String 없음 데이터 형식 유형
캐시된 결과 사용 TRUE/FALSE 부울 FALSE description

출력

Name 유형 설명
결과 데이터 집합 데이터 테이블 다운로드한 데이터가 포함된 데이터 집합입니다.

예외

예외 설명
오류 0027 두 개체의 크기가 같아야 하지만 다른 경우 예외가 발생합니다.
오류 0003 입력 중 하나 이상이 null이거나 비어 있으면 예외가 발생합니다.
오류 0029 잘못된 URI가 전달되면 예외가 발생합니다.
오류 0030 파일을 다운로드할 수 없으면 예외가 발생합니다.
오류 0002 하나 이상의 매개 변수를 구문 분석할 수 없거나 지정된 형식을 대상 방법에 필요한 형식으로 변환할 수 없으면 예외가 발생합니다.
오류 0009 Azure 저장소 계정 이름 또는 컨테이너 이름을 잘못 지정하는 경우 예외가 발생합니다.
오류 0048 파일을 열 수 없으면 예외가 발생합니다.
오류 0015 데이터베이스 연결에 실패하면 예외가 발생합니다.
오류 0046 지정한 경로에 디렉터리를 만들 수 없으면 예외가 발생합니다.
오류 0049 파일을 구문 분석할 수 없으면 예외가 발생합니다.

Studio(클래식) 모듈과 관련된 오류 목록은 Machine Learning 오류 코드를 참조하세요.

API 예외 목록은 Machine Learning REST API 오류 코드를 참조하세요.

참고 항목

데이터 가져오기
데이터 내보내기
HTTP를 통해 웹 URL에서 가져오기
Hive 쿼리에서 가져오기
Azure Table에서 가져오기
Azure Blob Storage에서 가져오기
데이터 피드 공급자에서 가져오기
온-프레미스 SQL Server 데이터베이스에서 가져오기