작업 영역 라이브러리(레거시)

Important

이 설명서는 사용 중지되었으며 업데이트되지 않을 수 있습니다. 이 콘텐츠에 언급된 제품, 서비스 또는 기술은 더 이상 지원되지 않습니다. 클러스터 라이브러리를 참조하세요.

참고 항목

작업 영역 라이브러리는 더 이상 사용되지 않으며 사용해서는 안 됩니다. 그러나 라이브러리를 작업 영역 파일로 저장하는 것은 작업 영역 라이브러리와는 별개이며 여전히 완전히 지원됩니다. 작업 영역 파일로 저장된 라이브러리를 직접 설치하여 컴퓨팅 또는 작업 작업을 수행할 수 있습니다.

작업 영역 라이브러리는 클러스터 설치 라이브러리를 만드는 로컬 리포지토리로 사용됩니다. 작업 영역 라이브러리는 조직에서 만든 사용자 지정 코드이거나 조직에서 표준화한 특정 버전의 오픈 소스 라이브러리일 수 있습니다.

Notebook이나 작업에서 사용하려면 먼저 클러스터에 작업 영역 라이브러리를 설치해야 합니다. 클러스터에 작업 영역 라이브러리 설치를 참조 하세요.

공유 폴더의 작업 영역 라이브러리는 작업 영역의 모든 사용자가 사용할 수 있는 반면 사용자 폴더의 작업 영역 라이브러리는 해당 사용자만 사용할 수 있습니다.

Important

Databricks Runtime 14.3 LTS 이하를 사용하는 경우 DBFS에서 라이브러리를 설치할 수 있습니다. 그러나 모든 작업 영역 사용자는 DBFS에 저장된 라이브러리 파일을 수정할 수 있습니다. Azure Databricks 작업 영역에서 라이브러리의 보안을 강화하기 위해 DBFS 루트에 라이브러리 파일을 저장하는 것은 기본적으로 Databricks Runtime 15.0 이상에서 사용되지 않으며 비활성화됩니다. DBFS 루트에 라이브러리 저장이 사용되지 않고 기본적으로 사용하지 않도록 설정됨을 참조하세요.

대신 Databricks 는 작업 영역 파일 또는 Unity 카탈로그 볼륨에 라이브러리를 업로드하거나 라이브러리 패키지 리포지토리를 사용하는 것이 좋습니다 . 워크로드가 이러한 패턴을 지원하지 않는 경우 클라우드 개체 스토리지에 저장된 라이브러리를 사용할 수도 있습니다.

작업 영역 라이브러리는 작업 영역 파일과 함께 저장된 라이브러리와 어떻게 다른가요?

"작업 영역 라이브러리"라는 용어는 작업 영역에 등록된 모든 라이브러리를 나타냅니다. 작업 영역 라이브러리는 Notebook 및 작업 영역 파일과 함께 표시되고 포함된 디렉터리에 대한 ACL 규칙을 따릅니다.

"작업 영역 파일"이라는 용어는 작업 영역에 저장된 임의의 파일을 가리킵니다. Python .whl 패키지를 작업 영역 파일로 저장한 다음 작업 영역 라이브러리로 등록할 수 있습니다. 작업 영역 파일이란?을 참조하세요.

라이브러리를 작업 영역 파일로 업로드할 수 있습니다. 작업 영역 파일 기본 사용을 참조하세요.

작업 영역 파일에 많은 파일 형식을 업로드할 수 있지만 작업 영역 파일을 사용하여 Python .whl 파일만 설치할 수 있습니다. 클러스터 범위 라이브러리를 참조 하세요.

Databricks Runtime 13.3 LTS 이상에서는 작업 영역 파일로 저장된 Python 휠 파일을 설치하는 데 사용할 %pip 수 있습니다. %pip를 사용하여 작업 영역 파일로 저장된 패키지 설치를 참조하세요.

작업 영역 라이브러리 만들기

  1. 라이브러리를 저장할 작업 영역 폴더를 마우스 오른쪽 단추로 클릭합니다.
  2. > 라이브러리 만들기를 선택합니다. 라이브러리 만들기 대화 상자가 나타납니다.
  3. 라이브러리 원본선택하고 적절한 절차를 따릅니다.

Jar, Python egg 또는 Python 휠 파일 업로드

참고 항목

Python Egg 파일 설치는 더 이상 사용되지 않으며 향후 Databricks 런타임 릴리스에서 제거될 예정입니다.

Important

Databricks Runtime 14.3 LTS 이하를 사용하는 경우 DBFS에서 라이브러리를 설치할 수 있습니다. 그러나 모든 작업 영역 사용자는 DBFS에 저장된 라이브러리 파일을 수정할 수 있습니다. Azure Databricks 작업 영역에서 라이브러리의 보안을 강화하기 위해 DBFS 루트에 라이브러리 파일을 저장하는 것은 기본적으로 Databricks Runtime 15.0 이상에서 사용되지 않으며 비활성화됩니다. DBFS 루트에 라이브러리 저장이 사용되지 않고 기본적으로 사용하지 않도록 설정됨을 참조하세요.

대신 Databricks 는 작업 영역 파일 또는 Unity 카탈로그 볼륨에 라이브러리를 업로드하거나 라이브러리 패키지 리포지토리를 사용하는 것이 좋습니다 . 워크로드가 이러한 패턴을 지원하지 않는 경우 클라우드 개체 스토리지에 저장된 라이브러리를 사용할 수도 있습니다.

  1. 라이브러리 원본 단추 목록에서 업로드를 선택합니다.
  2. Jar, Python Egg 또는 Python Whl을 선택합니다.
  3. 선택적으로 라이브러리 이름을 입력합니다.
  4. Jar, Egg 또는 Whl을 드롭 상자로 드래그하거나 드롭 상자를 클릭하고 파일로 이동합니다. 파일이 dbfs:/FileStore/jars에 업로드됩니다.
  5. 만들기를 클릭합니다. 라이브러리 상태 화면이 표시됩니다.

업로드된 JAR, Python Egg 또는 Python 휠 파일 참조

DBFS 루트, 개체 스토리지 또는 작업 영역 파일에 저장된 JAR, Python egg 또는 Python 휠 파일을 참조하여 새 작업 영역 라이브러리를 만들 수 있습니다. 이 워크플로에 따라 파일을 업로드하거나 이동하지 않고 라이브러리에 대한 포인터를 등록합니다.

Databricks Runtime 13.2 이상을 사용하면 Unity 카탈로그에서 볼륨을 참조할 수도 있습니다. 이 기능은 공개 미리 보기제공됩니다.

공유 액세스 모드의 경우 JAR을 allowlist에 추가해야 합니다. 공유 컴퓨팅의 허용 목록 라이브러리 및 초기화 스크립트를 참조 하세요.

  1. 라이브러리 원본 단추 목록에서 파일 경로/ADLS를 선택합니다.
  2. Jar, Python Egg 또는 Python Whl을 선택합니다.
  3. 선택적으로 라이브러리 이름을 입력합니다.
  4. 다음 예제와 같이 라이브러리 경로를 지정합니다.
    • abfss://container-name@storage-account-name.dfs.core.windows.net/path/to/library.whl
    • /Workspace/path/to/library.whl
    • dbfs:/path/to/library.whl
    • /Volumes/<catalog>/<schema>/<volume>/<path_to_library_file>
  5. 만들기를 클릭합니다. 라이브러리 상태 화면이 표시됩니다.

개체 스토리지의 라이브러리 작업에 대한 자세한 내용은 개체 스토리지에서 라이브러리 설치를 참조하세요.

작업 영역 파일에 대한 자세한 내용은 Azure Databricks의 파일 작업을 참조 하세요.

클러스터에 작업 영역 라이브러리 설치

참고 항목

Azure Databricks는 클러스터에 설치된 순서대로 모든 작업 영역 라이브러리를 처리합니다. 라이브러리 간에 종속성이 있는 경우 클러스터에서 설치 순서에 주의해야 할 수 있습니다.

Important

Databricks Runtime 14.3 LTS 이하를 사용하는 경우 DBFS에서 라이브러리를 설치할 수 있습니다. 그러나 모든 작업 영역 사용자는 DBFS에 저장된 라이브러리 파일을 수정할 수 있습니다. Azure Databricks 작업 영역에서 라이브러리의 보안을 강화하기 위해 DBFS 루트에 라이브러리 파일을 저장하는 것은 기본적으로 Databricks Runtime 15.0 이상에서 사용되지 않으며 비활성화됩니다. DBFS 루트에 라이브러리 저장이 사용되지 않고 기본적으로 사용하지 않도록 설정됨을 참조하세요.

대신 Databricks 는 작업 영역 파일 또는 Unity 카탈로그 볼륨에 라이브러리를 업로드하거나 라이브러리 패키지 리포지토리를 사용하는 것이 좋습니다 . 워크로드가 이러한 패턴을 지원하지 않는 경우 클라우드 개체 스토리지에 저장된 라이브러리를 사용할 수도 있습니다.

단일 사용자 액세스 모드에서는 할당된 보안 주체(사용자 또는 서비스 주체)의 ID가 사용됩니다. 공유 액세스 모드에서 라이브러리는 라이브러리를 설치한 사용자의 ID를 사용합니다. 격리되지 않은 공유 액세스 모드는 볼륨을 지원하지 않지만 공유 액세스 모드와 동일한 ID 할당을 사용합니다.

클러스터에 라이브러리를 설치하는 모든 옵션을 보려면 클러스터 라이브러리를 참조 하세요.

작업 영역에 이미 있는 라이브러리를 설치하려면 클러스터 UI 또는 라이브러리 UI에서 시작할 수 있습니다.

클러스터

  1. 사이드바에서 컴퓨팅 아이콘컴퓨팅을 클릭합니다.
  2. 클러스터 이름을 클릭합니다.
  3. 라이브러리 탭을 클릭합니다.
  4. 새로 설치를 클릭합니다.
  5. 라이브러리 원본 단추 목록에서 작업 영역 라이브러리를 선택합니다.
  6. 작업 영역 라이브러리를 선택합니다.
  7. 설치를 클릭합니다.

라이브러리

  1. 라이브러리가 포함된 폴더로 이동합니다.
  2. 라이브러리 이름을 클릭합니다.
  3. 라이브러리를 설치할 클러스터 옆의 확인란을 선택하고 설치를 클릭합니다. 실행 중인 클러스터만 목록에 표시됩니다.

작업 영역 라이브러리 세부 정보 보기

참고 항목

작업 영역 폴더는 작업 영역 라이브러리를 검색하고 ACL을 관리하는 데 편리합니다.

  1. 라이브러리가 포함된 작업 영역 폴더로 이동합니다.
  2. 라이브러리 이름을 클릭합니다.

라이브러리 세부 정보 페이지에는 실행 중인 클러스터와 라이브러리의 설치 상태가 표시됩니다. 라이브러리가 설치된 경우 페이지에 패키지 호스트에 대한 링크가 포함됩니다. 라이브러리가 업로드된 경우 페이지에 업로드된 패키지 파일에 대한 링크가 표시됩니다.

작업 영역 라이브러리 이동

참고 항목

작업 영역 폴더는 작업 영역 라이브러리를 검색하고 ACL을 관리하는 데 편리합니다. 작업 영역 라이브러리를 이동해도 파일은 이동되지 않지만 작업 영역 라이브러리에 액세스할 수 있는 사용자를 수정할 수 있습니다.

  1. 라이브러리가 포함된 작업 영역 폴더로 이동합니다.
  2. 라이브러리 이름을 마우스 오른쪽 단추로 클릭하고 이동을 선택합니다. 폴더 브라우저가 표시됩니다.
  3. 대상 폴더를 클릭합니다.
  4. 이동을 클릭합니다.

작업 영역 라이브러리 삭제

Important

작업 영역 라이브러리를 삭제하기 전에 모든 클러스터에서 이를 제거해야 합니다.

작업 영역 라이브러리를 삭제하려면:

  1. 라이브러리를 휴지통 폴더로 이동합니다.
  2. 휴지통 폴더에서 라이브러리를 영구적으로 삭제하거나 휴지통 폴더를 비우세요.