다음을 통해 공유


Databricks 태스크 구성 및 편집

이 문서에서는 워크플로 작업 영역 UI를 사용하여 태스크를 만들고, 구성하고, 편집하는 방법을 중점적으로 설명합니다.

Azure Databricks는 Databricks 작업의 구성 요소로 태스크를 관리합니다. 작업에는 하나 이상의 태스크가 있습니다. 첫 번째 태스크를 구성하여 작업 영역 UI에서 새 작업을 만듭니다. 새 작업을 구성하려면 Databricks 작업 구성 및 편집을 참조하세요.

각 태스크에는 태스크 논리를 실행하는 연결된 컴퓨팅 리소스가 있습니다. 서버리스를 사용하는 경우 Azure Databricks는 컴퓨팅 리소스를 구성합니다. 서버리스를 사용하지 않는 경우 작업용 컴퓨팅 구성을 참조하세요.

Azure Databricks에는 다음과 같은 태스크 구성을 위한 진입점 및 도구가 있습니다.

태스크 만들기 또는 구성

기존 태스크를 편집하거나 작업 영역 UI를 사용하여 새 태스크를 추가하려면 다음 단계를 사용하여 기존 작업을 선택합니다.

  1. 사이드바에서 워크플로 아이콘 워크플로를 클릭합니다.
  2. 이름 열에서 작업 이름을 클릭합니다.
  3. 태스크 탭을 클릭합니다. 그러면 태스크 그래프가 나타납니다.
  4. 태스크를 편집하려면 태스크 이름을 클릭합니다. 그러면 태스크 구성이 태스크 그래프 아래에 표시됩니다.
  5. 태스크를 추가하려면 태스크 추가 단추을 클릭합니다.

태스크 유형

구성 옵션 및 지침은 작업에 따라 다릅니다. 사용 가능한 태스크 유형은 다음과 같습니다.

태스크 복제

태스크를 복제하여 업스트림 종속성을 포함하여 기존 태스크의 모든 구성을 복사합니다.

태스크를 복제하려면 다음을 수행합니다.

  1. 태스크 그래프에서 태스크를 선택합니다.
  2. 태스크 복제 단추을 클릭합니다.
  3. 복제된 태스크 이름을 지정하고 복제를 클릭합니다.

태스크 삭제

태스크를 삭제하려면 다음을 수행합니다.

  1. 태스크 그래프에서 태스크를 선택합니다.
  2. 휴지통를 클릭하고 태스크 삭제를 선택합니다.

태스크 경로 복사

특정 태스크 유형(예: Notebook 태스크)을 사용하면 태스크 소스 코드에 대한 경로를 복사할 수 있습니다.

  1. 태스크 탭을 클릭합니다.
  2. 복사할 경로가 포함된 태스크를 선택합니다.
  3. 태스크 경로 옆에 있는 작업 복사 아이콘을 클릭하여 경로를 클립보드에 복사합니다.

고급 태스크 설정

다음 고급 설정은 실패한 태스크에 대한 재시도 및 응답하지 않는 태스크에 대한 시간 제한 정책을 제어합니다.

참고 항목

태스크 또는 작업 수준에서 알림을 설정할 수 있습니다. 작업 이벤트에 대한 이메일 및 시스템 알림 추가를 참조하세요.

재시도 정책 설정

태스크 재시도에 대한 기본 설정은 작업 구성에 따라 달라집니다. 대부분의 구성에서 기본 설정은 태스크 실패 시 태스크를 다시 시도하지 않습니다.

서버리스 작업은 기본적으로 재시도를 자동으로 최적화합니다. 재시도를 허용하지 않도록 서버리스 컴퓨팅 자동 최적화 구성을 참조하세요.

연속 작업은 지수 백오프 재시도 정책을 사용합니다. 연속 작업에 대한 오류 처리 방법을 참조하세요.

실패한 태스크 실행이 다시 시도되는 시기와 횟수를 결정하는 정책을 구성하려면 다시 시도 옆에 있는 + 추가를 클릭합니다.

다시 시도 간격은 실패한 실행 시작과 후속 다시 시도 실행 사이의 밀리초 단위로 계산됩니다.

참고 항목

시간 제한다시 시도를 모두 구성하는 경우 시간 제한이 각 다시 시도에 적용됩니다.

예상 완료 시간 또는 태스크에 대한 시간 제한 구성

예상 및 최대 완료 시간을 포함하여 태스크에 대한 선택적 기간 임계값을 구성할 수 있습니다. 기간 임계값을 구성하려면 기간 임계값을 클릭합니다.

태스크의 예상 완료 시간을 구성하려면 경고 필드에 기간을 입력합니다. 태스크가 이 임계값을 초과하면 이벤트가 트리거됩니다. 이 이벤트를 사용하여 태스크가 느리게 실행되는 경우 알릴 수 있습니다. 느리게 실행되거나 지연된 작업에 대한 알림 구성을 참조하세요.

태스크에 대한 최대 완료 시간을 구성하려면 시간 제한 필드에 최대 기간을 입력합니다. 태스크가 이 시간 내에 완료되지 않으면 Azure Databricks에서 상태를 "시간 초과"로 설정합니다.