작업 관리에서 클러스터에 제출된 작업을 모니터링하고 관리할 수 있습니다. 작업 목록에서 각 행은 작업을 나타내고 열에는 작업 속성, 작업 상태 및 메트릭 값이 표시됩니다. 작업 목록은 작업 세부 정보를 드릴다운하고 하나 이상의 작업에 대한 작업을 수행하기 위한 시작점을 제공합니다.
작업 큐의 순서는 작업 우선 순위 수준 및 제출 시간을 기반으로 합니다. 우선 순위 수준이 높은 작업은 우선 순위가 낮은 작업 전에 실행됩니다. 작업 제출 시간은 각 우선 순위 수준 내의 순서를 결정합니다. 다음을 통해 작업 큐의 순서를 조절할 수 있습니다.
다양한 유형의 작업 또는 다른 사용자 집합에 대한 유효한 우선 순위 범위를 정의하는 작업 템플릿 을 만듭니다.
제출된 작업의 우선 순위 수준을 수정하여 작업 큐의 순서를 변경합니다. 우선 순위 대역, 우선 순위 번호 또는 둘의 조합으로 우선 순위를 지정할 수 있습니다. 숫자 우선 순위는 0(최하위)에서 4000(가장 높음) 사이의 값을 가질 수 있습니다.
이 항목에서는 클러스터 작업을 관리하고 모니터링하는 방법에 대한 개요를 제공합니다.
작업 예약 정책 구성
작업 제출 정책: 작업 템플릿은 클러스터에 대한 사용자 지정 작업 제출 정책을 정의하는 기본 방법입니다. 작업 템플릿을 사용하면 작업 속성(예: 우선 순위 수준)에 대한 기본값 및 값 제약 조건 집합을 특정 사용자 집합과 연결할 수 있습니다. 자세한 내용은 작업 템플릿을 참조하세요.
리소스 할당 정책: 작업 스케줄러 구성은 큐에 대기된 작업에 리소스를 할당하는 방법을 결정합니다. HPC 작업 스케줄러 서비스를 구성할 때 예약 정책(예: 분산 모드 또는 대기 모드, 선점 및 백필), 오류 처리 및 작업 기록 옵션을 설정할 수 있습니다. 자세한 내용은 HPC 작업 스케줄러 서비스 구성을 참조하세요.
고급 정책 적용 및 라이선스 인식 일정: 사용자 지정 작업 제출 필터 및 작업 활성화 필터를 만들어 사이트별 작업 제출 정책 및 작업 활성화 정책(예: 라이선스 인식 일정)을 적용할 수 있습니다. 자세한 내용은 활성화 및 제출 필터 이해를 참조하세요.
작업 및 작업 보기
작업 모니터링: 작업 목록에는 클러스터의 작업에 대한 정보가 표시됩니다. 목록을 필터링 및 정렬하고 목록에 표시할 작업 속성 및 메트릭 값을 선택할 수 있습니다. 자세한 내용은 작업 목록 필터링 및 정렬을 참조하세요.
작업 세부 정보 드릴인: 목록에서 작업을 클릭하면 해당 작업에 대한 자세한 정보가 세부 정보 창에 표시됩니다. 작업 및 작업 결과를 볼 수도 있습니다. 자세한 내용은 작업 또는 작업 보기를 참조하세요.
시간 경과에 따른 작업 통계 추적: HPC 클러스터 관리자는 클러스터에 대한 작업 통계를 추적하는 여러 차트 및 보고서를 제공합니다. 자세한 내용은 차트 및 보고서: HPC 클러스터 관리자를 참조하세요.
작업 및 작업 작업 수행
클러스터 관리자 또는 작업 소유자로서 다음 작업을 수행할 수 있습니다.
작업 또는 작업 취소: 큐에서 작업 또는 작업을 제거하고 해당 리소스를 해제합니다.
작업 또는 작업 강제 취소: 작업 또는 작업을 즉시 중지합니다.
작업 또는 태스크 다시 큐에 넣기: 완료되지 않은 작업 또는 태스크를 큐에 다시 넣습니다.
작업 수정: 작업 속성(예: 우선 순위 수준)을 변경하거나 활성 작업에 작업을 추가합니다.
작업에 대해 제외된 노드 설정 및 지우기: 특정 노드에서 태스크가 일관되게 실패하는 경우 하나 이상의 작업에서 해당 노드를 제외할 수 있습니다. 노드에서 문제를 해결하는 경우 활성 작업의 제외된 노드 속성에서 해당 노드를 지울 수 있습니다.
진행률 및 진행률 메시지 작업 속성 설정: 작업에 대한 사용자 지정 진행률 정보를 제공합니다.
작업 또는 작업 복사: as-is또는 변경 내용을 사용하여 작업을 다시 실행합니다.
작업 또는 태스크를 파일에 저장: 작업 또는 작업 사양을 XML 설명 파일로 내보냅니다.