다음을 통해 공유


Dataiku에 연결

Dataiku는 데이터 준비, AutoML 및 MLOps를 위한 엔드투엔드 AI 플랫폼입니다. Databricks SQL 웨어하우스 및 Azure Databricks 클러스터를 Dataiku와 통합할 수 있습니다.

Partner Connect를 사용하여 Dataiku에 연결

참고 항목

Partner Connect는 Dataiku에 대해 SQL 웨어하우스만 지원합니다. 클러스터를 Dataiku에 연결하려면 Dataiku에 수동으로 연결합니다.

Partner Connect를 사용하여 Azure Databricks 작업 영역을 Dataiku에 연결하려면 다음을 수행합니다.

  1. 사이드바에서 파트너 연결 버튼 파트너 연결을 클릭합니다.

  2. 파트너 타일을 클릭합니다.

    참고 항목

    Dataiku 타일 안에 확인 표시 아이콘이 있는 경우 관리자가 이미 Partner Connect를 사용하여 Dataiku를 작업 영역에 연결한 것입니다. 5단계로 건너뜁니다. 파트너는 Azure Databricks 계정의 이메일 주소를 사용하여 기존 Dataiku 계정에 로그인하라는 메시지를 표시합니다.

  3. 드롭다운 목록에서 카탈로그를 선택한 후 다음을 클릭합니다.

    참고 항목

    작업 영역이 Unity 카탈로그를 사용하지만 파트너가 Partner Connect에서 Unity 카탈로그를 지원하지 않는 경우 작업 영역 기본 카탈로그가 사용됩니다. 작업 영역이 Unity 카탈로그를 지원하지 않는 경우 hive_metastore가 사용됩니다.

  4. 드롭다운 목록에서 스키마를 선택한 후 추가를 클릭합니다. 이 단계를 반복하여 여러 스키마를 추가할 수 있습니다.

  5. 다음을 클릭합니다.

    Partner Connect는 작업 영역에 다음 리소스를 만듭니다.

    Partner Connect는 또한 <PARTNER>_USER 서비스 주체에게 다음 권한을 부여합니다.

    • (Unity Catalog)USE CATALOG: 선택한 카탈로그 내의 개체와 상호 작용하는 데 필요합니다.
    • (Unity Catalog) USE SCHEMA: 선택한 스키마를 읽을 수 있는 권한을 부여합니다.
    • (Unity Catalog)CREATE SCHEMA: 선택한 카탈로그에서 스키마를 만들 수 있는 권한을 부여합니다.
    • (레거시 Hive 메타스토어) USAGE: hive_metastore및 선택된 스키마 내의 개체와 상호 작용하는 데 필요합니다.
    • (레거시 Hive 메타스토어) CREATE: hive_metastore에서 스키마를 만드는 기능을 부여합니다.
    • (레거시 Hive 메타스토어) READ_METADATA: 선택한 스키마의 메타데이터를 읽을 수 있는 권한을 부여합니다.
    • (레거시 Hive 메타스토어) SELECT: 선택한 스키마를 읽을 수 있는 권한을 부여합니다.
  6. 다음을 클릭합니다.

    이메일 상자에는 Azure Databricks 계정의 이메일 주소가 표시됩니다. Dataiku는 이 이메일 주소를 사용하여 새 파트너 계정을 만들거나 기존 파트너 계정에 로그인하라는 메시지를 표시합니다.

  7. Dataiku에 연결 또는 로그인을 클릭합니다.

    웹 브라우저에 Dataiku 웹 사이트가 표시되는 새 탭이 열립니다.

  8. Dataiku 웹 사이트에서 화면의 지침을 완료하여 평가판 Dataiku 계정을 만들거나 기존 Dataiku 계정에 로그인합니다.

Dataiku에 수동으로 연결

이 섹션에서는 Azure Databricks 작업 영역의 기존 SQL 웨어하우스 또는 클러스터를 Dataiku에 수동으로 연결하는 방법을 설명합니다.

참고 항목

Databricks SQL 웨어하우스의 경우 Partner Connect를 사용하여 Dataiku에 연결하여 환경을 간소화할 수 있습니다.

요구 사항

Dataiku에 수동으로 연결하기 전에 다음이 필요합니다.

  • Azure Databricks 작업 영역의 클러스터 또는 SQL 웨어하우스

  • 클러스터 또는 SQL 웨어하우스, 특히 서버 호스트 이름, 포트HTTP 경로 값에 대한 연결 세부 정보.

  • Azure Databricks 개인용 액세스 토큰 또는 Microsoft Entra ID(이전 Azure Active Directory) 토큰. 개인용 액세스 토큰을 만들려면 다음을 수행합니다.

    1. Azure Databricks 작업 영역의 위쪽 표시줄에서 Azure Databricks 사용자 이름을 클릭한 다음 드롭다운에서 설정을 선택합니다.
    2. 개발자를 클릭합니다.
    3. 액세스 토큰 옆에 있는 관리를 클릭합니다.
    4. 새 토큰 생성을 클릭합니다.
    5. (선택 사항) 나중에 이 토큰을 식별할 수 있도록 하는 설명을 입력하고 토큰의 기본 수명을 90일로 변경합니다. 수명이 없는 토큰을 만들려면(권장하지 않음) 수명(일) 상자를 비워 둡니다(공백).
    6. 생성을 클릭합니다.
    7. 표시된 토큰을 안전한 장소로 복사한 다음, 완료를 클릭합니다.

    참고 항목

    복사한 토큰을 안전한 위치에 저장합니다. 복사한 토큰을 다른 사용자와 공유하지 마세요. 복사한 토큰을 분실하면 정확히 동일한 토큰을 다시 생성할 수 없습니다. 대신 이 프로시저를 반복하여 새 토큰을 만들어야 합니다. 복사한 토큰을 분실한 경우, 또는 토큰이 손상되었다고 생각되면, Databricks의 권장 사항에 따라 액세스 토큰 페이지에서 토큰 옆에 있는 휴지통(취소)아이콘을 클릭하여 작업 영역에서 해당 토큰을 즉시 삭제할 것을 강력하게 권장합니다.

    작업 영역에서 토큰을 만들거나 사용할 수 없는 경우, 작업 영역 관리자가 토큰을 사용하지 않도록 설정했거나 토큰을 만들거나 사용할 수 있는 권한을 부여하지 않았기 때문일 수 있습니다. 작업 영역 관리자 또는 다음 주제를 참조하세요.

    참고 항목

    보안 모범 사례로, 자동화된 도구, 시스템, 스크립트, 앱을 사용하여 인증할 때 Databricks는 작업 영역 사용자 대신 서비스 주체에 속한 개인용 액세스 토큰을 사용하는 것을 권장합니다. 서비스 주체에 대한 토큰을 만들려면 서비스 주체에 대한 토큰 관리를 참조하세요.

연결 단계

수동으로 Dataiku에 연결하려면 Dataiku 설명서의 Databricks를 따릅니다.

추가 리소스

다음 Dataiku 리소스를 탐색해 보세요.