Share via


Azure의 클라우드 규모 분석을 사용한 SAP 수집

Azure는 BusinessWare 및 SAP ECC(ERP 중앙 구성 요소)를 포함하여 SAP 데이터 원본에서 데이터를 추출하고 수집하기 위한 다양한 방법을 지원할 수 있습니다. SAP 시스템은 모놀리식 구조가 여러 도메인에 걸쳐 있기 때문에 복잡합니다. 권장되는 패턴은 각 비즈니스 그룹이 SAP에서 데이터 랜딩 존으로 데이터를 수집하는 것입니다. 데이터는 보강된 계층(원시를 통과한 경우)에 표시되며 Microsoft Entra 그룹 액세스 제어에 따라 액세스할 수 있습니다. 중앙 재무 팀은 데이터 랜딩 존의 요구 사항에 도움이 되는 단일 데이터 자산으로 재무 개체를 큐레이팅하고 수집할 수 있습니다.

조직의 데이터 볼륨 및 대기 시간 요구 사항에 따라 세 가지 패턴 중 하나가 수집 요구 사항을 지원할 수 있습니다.

Azure Data Factory

Data Factory는 SAP 시스템 및 다양한 데이터베이스(SAP HANA 포함)에 대한 여러 커넥터를 제공합니다. 코드가 없는 간단한 데이터 변환을 몇 분 안에 빌드하는 데 사용할 수 있습니다. 델타 복제는 기본 제공으로 사용할 수 없지만 일부 프로그래밍을 통해 달성할 수 있습니다. Azure Data Factory는 최소 15분 간격으로 일괄 처리 또는 마이크로배치에 대해서만 지원됩니다.

PULL 옵션으로 설명된 이 Data Factory 옵션은 SAP에 대한 Single Sign-On 및 Secure Network Communication 인증을 지원합니다. 또한 코드 없는 데이터 변환을 사용하여 유연한 데이터 준비 및 보강 코딩을 위해 Azure Databricks와 통합할 수 있는 복원력 있는 데이터 흐름을 빌드하는 옵션도 제공합니다. 일괄 처리로 제한되며 델타 추출을 지원하려면 코딩 논리가 필요합니다. 또한 SAP ODP(Operational Data Provisioning) 프레임워크를 활용하는 새 SAP ODP 커넥터를 평가할 수도 있습니다. 이 새 커넥터는 전체 및 증분 데이터 로드를 수행하기 위해 ODP를 지원하는 모든 SAP 시스템에 연결할 수 있습니다.

SAP 가로 변환 복제 서버 및 비즈니스 개체 데이터 서비스

SAP SLT(가로 변환 복제 서버)는 트리거 기반 복제를 사용하여 데이터를 추출하는 SAP NetWeaver 추가 기능입니다. 이 서비스는 원본의 BODS(비즈니스 개체 데이터 서비스)와 통합되어 추출, 로드, 변환 기능을 제공하고 전송할 데이터 세트 파일을 만듭니다. 이 옵션은 일괄 처리 및 근 실시간 수집 모두에 대해 고려할 수 있습니다.

PUSH 옵션으로 설명된 이 SAP 기반 옵션은 모든 SAP 데이터에 대한 간단하고 통합된 구성으로 트리거 기반 복제 및 근 실시간 추출을 용이하게 합니다. 이를 위해서는 AzCopy와 같은 파일 복사 도구에 의존하는 여러 네트워크 홉을 포함하여 SAP 라이선스, 추가 다운스트림 단계, Azure로 데이터 이동 예약이 필요합니다.

타사 도구

SAP 원본에서 실시간으로 부가 가치 추출 및 수집을 제공할 수 있는 많은 타사 도구가 있습니다. Microsoft는 Qlik Replicate(이전에는 Attunity), Simplement Data LiberatorKagool Velocity를 권장합니다. 각 기능은 비슷한 기능을 제공하며 근 실시간으로 SAP에서 데이터를 추출하고 비즈니스 컨텍스트 및 인텔리전스를 즉시 제공할 수 있습니다.

이러한 서비스는 기술 아키텍처에서 다릅니다. Qlik Replicate 및 Simplement Data Liberator는 원본 데이터베이스 로그의 변경 내용을 식별하여 근 실시간으로 복제를 제공합니다. Kagool Velocity는 SAP NetWeaver에 대한 추가 기능을 사용하고 애플리케이션 계층에 주석 요청을 제출하여 데이터를 노출합니다. 앞에서 언급한 옵션에 비해 이러한 옵션은 더 나은 기본 기능과 근 실시간 지원을 제공하지만 타사 기술이 필요합니다.

권장

  • 기본 권장 사항은 SAP ODP 커넥터를 다음과 같이 사용하는 것입니다.

    • SAP ECC 추출기, SAP S/4HANA CDS 뷰, SAP BW, SAP BW4/HANA, SAP SLT, SAP HANA Views에 연결하는 단일 커넥터를 제공합니다.

    • SAP S/4HANA 및 SAP BW에서 데이터를 더 쉽게 추출할 수 있도록 이미 제공된 기존 CDS 보기 및 사용자 지정 만든 뷰를 사용합니다.

    • 테이블 수준에서 트리거 기반 데이터 캡처를 허용하는 SLT를 사용할 수 있습니다.

    • Azure Data Factory 및 Synapse Pipelines에서 데이터 흐름을 사용하면 워터마크 없이 데이터 추출을 간단하게 만들 수 있습니다.

    • 데이터 흐름은 ODP 메타데이터에 따라 올바른 순서를 사용하여 싱크의 변경 내용을 적용하기 위한 기본 제공 기능을 제공하며 개발자가 inserts/updates/deletes/upsert를 처리하는 사용자 지정 코드를 만드는 데 필요한 복잡성을 완전히 숨깁니다.

    • 데이터 흐름은 실패한 추출 중에 복구를 실행하는 사용자 지정 논리가 필요하지 않은 ODQ 프레임워크의 복구 메커니즘을 투명하게 사용합니다.

    • 데이터 흐름은 데이터 추출 성능을 향상시키기 위해 높은 처리량(병렬 읽기, 분할 등을 통해)의 이점을 제공합니다.

  • 하이브리드 접근 방식을 사용하는 것도 사용 가능한 옵션이며 SAP 데이터에 대한 수집 전략의 역할을 하는 몇 가지 옵션으로 구성됩니다. SAP SLT, BODS, Qlik는 SAP 트랜잭션 시스템(예: SAP ECC)에서 데이터를 추출하는 데 사용되며, Data Factory는 Azure Data Lake Storage에 쓰기 전에 데이터를 Parquet 형식으로 변환하기 위해 Azure로 데이터를 가져옵니다. SAP NetWeaver Business Warehouse에서 독립적으로 데이터를 추출하여 기존 프레임워크를 활용합니다.

다음 단계

자동화된 수집 프레임워크가 Azure에서 클라우드 규모 분석을 지원하는 방법