다음을 통해 공유


FHIR 서비스의 성능 향상을 위한 모범 사례

이 문서에서는 Azure Health Data Services FHIR® 서비스의 모범 사례에 대한 지침을 제공합니다. FHIR 서비스의 성능을 향상시키기 위해 수행해야 할 것, 고려해야 할 것, 또는 피해야 할 것에 대한 사례를 찾을 수 있습니다.

비고

이 문서는 Azure Health Data Services FHIR 서비스 고객에 대해 범위가 지정됩니다.

데이터 수집

가져오기 작업

Azure FHIR 서비스는 가져오기 작업을 통해 데이터 수집을 지원하며, 이 작업은 초기 모드와 증분 모드라는 두 가지 모드를 제공합니다. 자세한 지침은 FHIR 서비스 설명서로 데이터 가져오기를 참조하세요.

가져오기 작업을 사용하여 최적의 성능을 얻으려면 다음 모범 사례를 고려하세요.

  • 수행: 데이터를 수집하는 동안 대용량 파일을 사용합니다. 가져오기에 가장 적합한 NDJSON 파일 크기는 50MB 이상(또는 상한이 없는 20,000개 이상의 리소스)입니다. 더 작은 파일을 더 큰 파일로 결합하면 성능이 향상됩니다.
  • 고려: HTTP API 요청을 통해 가져오기 작업을 사용하여 데이터를 FHIR 서비스로 수집합니다. 가져오기 작업은 높은 처리량을 제공하며 데이터를 로드하는 확장 가능한 방법입니다.
  • 고려: 최적의 성능을 위해 단일 가져오기 작업에서 모든 FHIR 리소스 파일을 가져옵니다. 한 작업에서 총 파일 크기가 100GB 이상(또는 상한이 없는 1억 개 리소스)을 목표로 합니다. 이러한 방식으로 가져오기를 최대화하면 여러 가져오기 작업 관리와 관련된 오버헤드를 줄일 수 있습니다.
  • 더 나은 처리량을 위해 동일한 리소스 종류에 매핑되는 리소스를 사용하여 가져오기 작업을 수행하는 것이 좋습니다.
  • 고려: 필요한 경우에만 여러 동시 가져오기를 실행하지만 병렬 가져오기 작업을 제한합니다. 단일 대규모 가져오기는 사용 가능한 모든 시스템 리소스를 사용하도록 설계되었으며, 동시 가져오기 작업에서는 처리량이 증가하지 않습니다.

번들

Azure FHIR 서비스에서 번들은 여러 리소스에 대한 컨테이너 역할을 합니다. 일괄 처리 및 트랜잭션 번들을 사용하면 단일 HTTP 요청 또는 응답으로 작업 집합을 제출할 수 있습니다. 번들 수집을 통해 더 높은 처리량을 달성하려면 다음을 고려하세요.

  • 수행: Azure FHIR 서비스에서 선형 방식으로 부하를 생성하고 버스트 작업을 방지하여 성능 저하를 방지합니다.
  • 수행: FHIR 서버에 대한 동시 번들 요청 수를 조정합니다. 숫자(>100)가 높으면 부정적 확장성 및 처리량 감소로 이어질 수 있습니다.
  • 서로 의존하지 않고 별도로 업데이트할 수 있는 FHIR 리소스에 대해 별도의 트랜잭션 번들을 사용합니다.
  • 조건부 생성 또는 업데이트와 같은 복잡한 작업에 더 작은 번들 크기를 사용하는 것이 좋습니다.
  • 고려: 일괄 처리 및 트랜잭션 번들에 대해 병렬 처리를 사용하도록 설정합니다. 기본적으로 번들의 리소스는 순차적으로 처리됩니다. 처리량을 향상시키기 위해 HTTP 헤더 플래그 x-bundle-processing-logic 를 추가하고 으로 설정하여 병렬 리소스 처리를 사용하도록 설정할 수 있습니다 parallel. 자세한 내용은 일괄 처리 번들 병렬 처리 설명서를 참조하세요.
  • 피하기: 동일한 리소스를 동시에 업데이트하려고 하는 병렬 번들 요청을 제출하지 않도록 하여 처리가 지연될 수 있습니다.
  • 단일 PUT 또는 POST 요청으로 많은 수의 번들을 제출하지 않도록 하면 트랜잭션 병목 현상이 발생할 수 있습니다.

비고

플래그를 x-bundle-processing-logic 사용하는 병렬 번들 처리는 HTTP 작업 내의 리소스 순서에 대한 암시적 종속성이 없는 경우 처리량을 향상시킬 수 있습니다.

검색 매개 변수 인덱스 튜닝

Azure FHIR 서비스는 리소스당 미리 정의된 검색 매개 변수를 사용하여 프로비전됩니다. 검색 매개 변수는 사용 편의성과 효율적인 검색을 위해 인덱싱됩니다. 인덱스는 FHIR 서비스의 모든 쓰기에 대해 업데이트됩니다. 선택 가능한 검색 매개 변수를 사용하면 기본 제공 검색 매개 변수 인덱스를 사용하거나 사용하지 않도록 설정할 수 있습니다. 이 기능을 사용하면 필요한 검색 매개 변수만 사용하도록 설정하여 스토리지 사용 및 성능을 최적화할 수 있습니다. 관련 검색 매개 변수에 집중하면 수집 중에 검색되는 데이터의 양을 최소화할 수 있습니다.

조직에서 성능을 최적화하는 데 사용하지 않는 검색 인덱스를 사용하지 않도록 설정하는 것이 좋습니다.

쿼리 성능 최적화

데이터 수집 후 쿼리 성능을 최적화하는 것이 중요합니다. 최적의 성능을 보장하려면

  • 수행: Azure FHIR 서비스에서 선형 방식으로 부하를 생성하고 버스트 작업을 방지하여 성능 저하를 방지합니다.
  • 가장 선택적인 검색 매개 변수를 고려하십시오 (예: identifier) 카디널리티가 낮은 매개 변수보다 인덱스 사용을 최적화하십시오.
  • 고려: 논리 식별자를 사용하여 결정적 검색을 수행합니다. FHIR 서비스는 리소스를 식별하는 두 가지 방법인 논리 식별자 및 비즈니스 식별자를 제공합니다.
    논리 식별자는 그와 함께 수행된 FHIR 작업이 예측 가능하기 때문에 "결정적"인 것으로 간주됩니다. 비즈니스 식별자는 시스템 상태에 따라 작업 동작이 다르기 때문에 "조건부"로 간주됩니다. 논리 식별자를 사용하는 결정적 작업이 권장됩니다.
  • 고려하세요 해당하는 경우 POST 대신 PUT HTTP 동사를 사용하는 것을. PUT 요청은 데이터 무결성을 유지하고 리소스 관리를 최적화하는 데 도움이 될 수 있습니다. POST 요청은 리소스 중복, 데이터 품질 저하, 불필요하게 FHIR 데이터 크기 증가로 이어질 수 있습니다.
  • 바인딩되지 않은 결과 집합 및 더 높은 대기 시간이 발생할 수 있으므로 검색 쿼리에서 사용하지 _revinclude 합니다.
  • 쿼리 성능에 영향을 주므로 복잡한 검색(예: 또는 연결된 검색 매개 변수)을 사용하지 _has.

데이터 추출

데이터 추출의 경우 $export에 지정된 대로 대량 작업을 사용합니다.

  • 수행: 필터를 사용하여 처리량을 최대화하지 않을 경우 시스템 수준 내보내기를 위해 더 큰 데이터 블록을 사용합니다. Azure FHIR 서비스는 자동으로 병렬 작업으로 분할합니다.
  • 고려: 내보낼 수 있는 작은 데이터 블록으로 환자, 그룹 및 필터링된 시스템 내보내기를 분할합니다.

내보내기 작업에 대한 자세한 내용은 FHIR 데이터 내보내기를 참조하세요.

FHIR 리소스에 이진 데이터 저장

  • FHIR 리소스 내에서 base64로 인코딩된 문자열로 작은 페이로드(최대 2MB)를 저장합니다.
  • 더 큰 이진 데이터에 외부 스토리지 솔루션을 사용하는 것이 좋습니다. Blob Storage에 이진 데이터를 저장하고 비효율성을 방지하기 위해 URL을 사용하여 FHIR 리소스에서 참조합니다.
  • 대형 이진 파일을 분할하는 것을 고려해 보십시오. 2MB 미만의 더 작은 청크로 나누어 별도의 이진 리소스로 저장하고, FHIR 리소스를 사용하여 서로 연결할 수 있습니다.
  • 가져오기, 내보내기 및 검색과 같은 FHIR 서비스 기능의 제한 및 비효율성이 발생할 수 있으므로 FHIR 리소스 내에 직접 큰 이진 데이터를 저장하지 마세요.

이러한 모범 사례를 적용하면 Azure FHIR 서비스에서 데이터 수집, 번들 처리, 쿼리 실행 및 데이터 추출의 성능과 효율성을 높일 수 있습니다.

비고

FHIR®은 HL7의 등록 상표이며, HL7의 사용 허가 하에 사용됩니다.