클라우드 네이티브 데이터 패턴

팁 (조언)

이 콘텐츠는 eBook, Architecting Cloud Native .NET Applications for Azure에서 발췌한 것으로, .NET Docs 또는 오프라인에서 읽을 수 있는 다운로드 가능한 무료 PDF로 제공됩니다.

PDF 다운로드

이 책 전체에서 살펴본 것처럼 클라우드 네이티브 접근 방식은 애플리케이션을 디자인, 배포 및 관리하는 방식을 변경합니다. 또한 데이터를 관리하고 저장하는 방식도 변경됩니다.

그림 5-1은 차이점을 대조합니다.

클라우드 네이티브 애플리케이션의 데이터 스토리지

그림 5-1. 클라우드 네이티브 애플리케이션의 데이터 관리

숙련된 개발자는 그림 5-1의 왼쪽에서 아키텍처를 쉽게 인식할 수 있습니다. 이 모놀리식 애플리케이션에서 비즈니스 서비스 구성 요소는 공유 서비스 계층에 함께 배치되어 단일 관계형 데이터베이스의 데이터를 공유합니다.

여러 가지 면에서 단일 데이터베이스는 데이터 관리를 단순하게 유지합니다. 여러 테이블에서 데이터를 쿼리하는 것은 간단합니다. 데이터 업데이트에 대한 변경 사항들은 모두 함께 업데이트되거나, 그렇지 않으면 전부 되돌려집니다. ACID 트랜잭션은 강력하고 즉각적인 일관성을 보장합니다.

클라우드 네이티브를 위한 디자인은 다른 접근 방식을 취합니다. 그림 5-1의 오른쪽에서 비즈니스 기능이 어떻게 작고 독립적인 마이크로 서비스로 분리되는지 확인합니다. 각 마이크로 서비스는 특정 비즈니스 기능 및 자체 데이터를 캡슐화합니다. 모놀리식 데이터베이스는 각각 마이크로 서비스에 맞춰 여러 개의 작은 데이터베이스가 있는 분산 데이터 모델로 분해됩니다. 연기가 지워지면 마이크로 서비스당 데이터베이스를 노출하는 디자인으로 등장합니다.

마이크로 서비스당 데이터베이스, 그 이유는 무엇인가요?

마이크로 서비스당 이 데이터베이스는 특히 빠르게 발전하고 대규모를 지원해야 하는 시스템의 경우 많은 이점을 제공합니다. 이 모델을 사용하여...

도메인 데이터는 서비스 내에서 캡슐화됩니다.
데이터 스키마는 다른 서비스에 직접적인 영향을 주지 않고 발전할 수 있습니다.
각 데이터 저장소는 독립적으로 확장할 수 있습니다.
한 서비스의 데이터 저장소 오류는 다른 서비스에 직접적인 영향을 주지 않습니다.

또한 데이터를 분리하면 각 마이크로 서비스에서 워크로드, 스토리지 요구 사항 및 읽기/쓰기 패턴에 가장 적합한 데이터 저장소 형식을 구현할 수 있습니다. 선택 항목에는 관계형, 문서, 키-값 및 그래프 기반 데이터 저장소도 포함됩니다.

그림 5-2는 클라우드 네이티브 시스템에서 다국어 지속성의 원칙을 제시합니다.

Polyglot 데이터 지속성

그림 5-2. Polyglot 데이터 지속성

이전 그림에서는 각 마이크로 서비스가 다른 유형의 데이터 저장소를 지원하는 방법을 확인합니다.

제품 카탈로그 마이크로 서비스는 기본 데이터의 풍부한 관계형 구조를 수용하기 위해 관계형 데이터베이스를 사용합니다.
쇼핑 카트 마이크로 서비스는 간단한 키-값 데이터 저장소를 지원하는 분산 캐시를 사용합니다.
주문 마이크로 서비스는 대량의 읽기 작업을 수용하기 위해 비정규화된 키/값 저장소와 함께 쓰기 작업에 NoSql 문서 데이터베이스를 모두 사용합니다.

관계형 데이터베이스는 복잡한 데이터가 있는 마이크로 서비스와 여전히 관련이 있지만 NoSQL 데이터베이스는 상당한 인기를 얻고 있습니다. 대규모 및 고가용성을 제공합니다. 스키마 없는 특성을 통해 개발자는 형식화된 데이터 클래스 및 ORM의 아키텍처에서 벗어나 변경 비용이 많이 들고 시간이 많이 소요됩니다. 이 장 뒷부분에 나오는 NoSQL 데이터베이스에 대해 설명합니다.

데이터를 별도의 마이크로 서비스로 캡슐화하면 민첩성, 성능 및 확장성을 높일 수 있지만 많은 과제가 있습니다. 다음 섹션에서는 이러한 과제를 극복하는 데 도움이 되는 패턴 및 사례와 함께 설명합니다.

서비스 간 쿼리

마이크로 서비스는 독립적이며 인벤토리, 배송 또는 주문과 같은 특정 기능 기능에 중점을 두지만 다른 마이크로 서비스와의 통합이 필요한 경우가 많습니다. 통합에는 데이터에 대해 다른 마이크로 서비스를 쿼리하는 마이크로 서비스가 포함되는 경우가 많습니다. 그림 5-3은 시나리오를 보여줍니다.

마이크로 서비스 간 쿼리

그림 5-3. 마이크로 서비스 간 쿼리

앞의 그림에서는 사용자의 장바구니에 항목을 추가하는 장바구니 마이크로 서비스가 표시됩니다. 이 마이크로 서비스의 데이터 저장소에는 장바구니 및 품목 데이터가 포함되어 있지만 제품 또는 가격 책정 데이터는 유지되지 않습니다. 대신 이러한 데이터 항목은 카탈로그 및 가격 책정 마이크로 서비스에서 소유합니다. 이 측면은 문제를 제공합니다. 데이터베이스에 제품이나 가격 책정 데이터가 없는 경우 장바구니 마이크로 서비스가 사용자의 장바구니에 제품을 추가하려면 어떻게 해야 할까요?

4장에서 설명하는 한 가지 옵션은 장바구니에서 카탈로그 및 가격 책정 마이크로 서비스로의 직접 HTTP 호출 입니다. 그러나 4장에서는 동기 HTTP가 마이크로 서비스를 함께 호출하여 자율성을 줄이고 아키텍처 이점을 줄인 것이라고 말했습니다.

각 서비스에 대해 별도의 인바운드 및 아웃바운드 큐를 사용하여 요청-회신 패턴을 구현할 수도 있습니다. 그러나 이 패턴은 복잡하며 요청 및 응답 메시지의 상관 관계를 지정하려면 배관이 필요합니다. 백 엔드 마이크로 서비스 호출을 분리하는 동안 호출 서비스는 호출이 완료되기를 동기적으로 기다려야 합니다. 네트워크 정체, 일시적인 오류 또는 오버로드된 마이크로 서비스로 인해 장기 실행 및 실패한 작업이 발생할 수 있습니다.

대신, 교차 서비스 종속성을 제거하기 위해 널리 허용되는 패턴은 그림 5-4에 표시된 구체화된 뷰 패턴입니다.

구체화된 뷰 패턴

그림 5-4. 구체화된 뷰 패턴

이 패턴을 사용하면 장바구니 서비스에 로컬 데이터 테이블( 읽기 모델이라고 함)을 배치합니다. 이 표에는 제품 및 가격 책정 마이크로 서비스에서 필요한 데이터의 비정규화된 복사본이 포함되어 있습니다. 데이터를 장바구니 마이크로 서비스에 직접 복사하면 비용이 많이 드는 서비스 간 호출이 필요하지 않습니다. 서비스에 대한 로컬 데이터를 사용하여 서비스의 응답 시간과 안정성을 향상시킵니다. 또한 자체 데이터 복사본을 사용하면 장바구니 서비스의 복원력이 향상됩니다. 카탈로그 서비스를 사용할 수 없게 되면 장바구니 서비스에 직접적인 영향을 주지 않습니다. 장바구니가 자체 매장의 데이터로 계속 작동할 수 있습니다.

이 방법을 사용하면 이제 시스템에 중복 데이터가 있다는 것을 확인할 수 있습니다. 그러나 클라우드 네이티브 시스템에서 데이터를 전략적으로 복제하는 것은 확립된 관행이며 안티 패턴 또는 잘못된 관행으로 간주되지 않습니다. 하나의 서비스만 데이터 집합을 소유할 수 있으며 데이터 집합에 대한 권한을 가질 수 있습니다. 레코드 시스템이 업데이트되면 읽기 모델을 동기화해야 합니다. 동기화는 일반적으로 그림 5.4와 같이 게시/구독 패턴을 사용하는 비동기 메시징을 통해 구현됩니다.

분산 트랜잭션

마이크로 서비스에서 데이터를 쿼리하는 것은 어렵지만 여러 마이크로 서비스에서 트랜잭션을 구현하는 것은 훨씬 더 복잡합니다. 서로 다른 마이크로 서비스의 독립적인 데이터 원본에서 데이터 일관성을 유지 관리해야 하는 본질적인 과제는 과소 평가될 수 없습니다. 클라우드 네이티브 애플리케이션에서 분산 트랜잭션이 없다는 것은 분산 트랜잭션을 프로그래밍 방식으로 관리해야 한다는 것을 의미합니다. 즉각적인 일관성의 세계에서 최종 일관성의 세계로 이동합니다.

그림 5-5는 문제를 보여 줍니다.

사가 패턴에서의 트랜잭션

그림 5-5. 마이크로 서비스에서 트랜잭션 구현

앞의 그림에서 5개의 독립 마이크로 서비스는 주문을 만드는 분산 트랜잭션에 참여합니다. 각 마이크로 서비스는 자체 데이터 저장소를 유지하고 해당 저장소에 대한 로컬 트랜잭션을 구현합니다. 주문을 만들려면 각 개별 마이크로 서비스에 대한 로컬 트랜잭션이 성공해야 합니다. 그렇지 않으면 모두 작업을 중단하고 롤백해야 합니다. 각 마이크로 서비스 내에서 기본 제공 트랜잭션 지원을 사용할 수 있지만 데이터를 일관성 있게 유지하기 위해 5개 서비스 모두에 걸쳐 있는 분산 트랜잭션은 지원되지 않습니다.

대신 이 분산 트랜잭션을 프로그래밍 방식으로 구성해야 합니다.

분산 트랜잭션 지원을 추가하는 인기 있는 패턴은 Saga 패턴입니다. 로컬 트랜잭션을 프로그래밍 방식으로 그룹화하고 각 트랜잭션을 순차적으로 호출하여 구현됩니다. 로컬 트랜잭션이 실패하면 Saga는 작업을 중단하고 보상 트랜잭션 집합을 호출합니다. 보상 트랜잭션은 이전 로컬 트랜잭션의 변경 내용을 실행 취소하고 데이터 일관성을 복원합니다. 그림 5-6은 Saga 패턴이 있는 실패한 트랜잭션을 보여 줍니다.

사가 패턴으로 롤백

그림 5-6. 트랜잭션 롤백

이전 그림에서 인벤토리 업데이트 작업이 인벤토리 마이크로 서비스에서 실패했습니다. Saga는 보상 트랜잭션 집합(빨간색)을 호출하여 재고 수를 조정하고, 지불 및 주문을 취소하고, 각 마이크로 서비스의 데이터를 다시 일관된 상태로 반환합니다.

사가 패턴은 일반적으로 일련의 관련 이벤트로 안무되거나 관련 명령 집합으로 오케스트레이션됩니다. 4장에서는 오케스트레이션된 사가 구현의 기초가 될 서비스 집계 패턴에 대해 설명했습니다. 또한 안무형 사가 구현의 기반이 되는 Azure Service Bus 및 Azure Event Grid 토픽과 관련하여 이벤트를 논의했습니다.

대용량 데이터

대규모 클라우드 네이티브 애플리케이션은 대용량 데이터 요구 사항을 지원하는 경우가 많습니다. 이러한 시나리오에서는 기존의 데이터 스토리지 기술로 인해 병목 현상이 발생할 수 있습니다. 대규모로 배포되는 복잡한 시스템의 경우 CQRS(명령 및 쿼리 책임 분리) 및 이벤트 소싱 모두 애플리케이션 성능을 향상시킬 수 있습니다.

CQRS

CQRS는 성능, 확장성 및 보안을 최대화하는 데 도움이 되는 아키텍처 패턴입니다. 이 패턴은 데이터를 읽는 작업을 데이터를 쓰는 작업과 구분합니다.

일반적인 시나리오의 경우 읽기 및 쓰기 작업 모두 에 동일한 엔터티 모델과 데이터 리포지토리 개체가 사용됩니다.

그러나 대용량 데이터 시나리오는 읽기 및 쓰기에 대한 별도의 모델 및 데이터 테이블을 활용할 수 있습니다. 성능을 향상시키기 위해 읽기 작업은 데이터의 비정규화된 표현을 쿼리하여 비용이 많이 드는 반복적인 테이블 조인 및 테이블 잠금을 방지할 수 있습니다. 명령이라고 하는 쓰기 작업은 일관성을 보장하는 데이터의 정규화된 표현에 대해 업데이트됩니다. 그런 다음 두 표현을 동기화 상태로 유지하는 메커니즘을 구현해야 합니다. 일반적으로 쓰기 테이블이 수정될 때마다 읽기 테이블에 수정 내용을 복제하는 이벤트를 게시합니다.

그림 5-7은 CQRS 패턴의 구현을 보여 줍니다.

명령 및 쿼리 책임 분리

그림 5-7. CQRS 구현

이전 그림에서는 별도의 명령 및 쿼리 모델이 구현됩니다. 각 데이터 쓰기 작업은 쓰기 저장소에 저장되고 읽기 저장소로 전파됩니다. 최종 일관성 원칙에 따라 데이터 전파 프로세스가 작동하는 방식에 주의 하세요. 읽기 모델은 결국 쓰기 모델과 동기화되지만 프로세스에 약간의 지연이 있을 수 있습니다. 다음 섹션에서는 최종 일관성에 대해 설명합니다.

이러한 분리를 통해 읽기 및 쓰기를 독립적으로 확장할 수 있습니다. 읽기 작업은 쿼리에 최적화된 스키마를 사용하는 반면, 쓰기는 업데이트에 최적화된 스키마를 사용합니다. 읽기 쿼리는 비정규화된 데이터에 반하는 반면, 복잡한 비즈니스 논리는 쓰기 모델에 적용할 수 있습니다. 또한 읽기를 노출하는 작업보다 쓰기 작업에 더 엄격한 보안을 적용할 수 있습니다.

CQRS를 구현하면 클라우드 네이티브 서비스의 애플리케이션 성능을 향상시킬 수 있습니다. 그러나 더 복잡한 디자인이 발생합니다. 이 원칙을 클라우드 네이티브 애플리케이션의 해당 섹션에 신중하고 전략적으로 적용하여 이점을 얻을 수 있습니다. CQRS에 대한 자세한 내용은 Microsoft 책 .NET 마이크로 서비스: 컨테이너화된 .NET 애플리케이션에 대한 아키텍처를 참조하세요.

이벤트 소싱

대용량 데이터 시나리오를 최적화하는 또 다른 방법은 이벤트 소싱과 관련이 있습니다.

시스템은 일반적으로 데이터 엔터티의 현재 상태를 저장합니다. 예를 들어 사용자가 전화 번호를 변경하면 고객 레코드가 새 번호로 업데이트됩니다. 데이터 엔터티의 현재 상태를 항상 알고 있지만 각 업데이트는 이전 상태를 덮어씁니다.

대부분의 경우 이 모델은 정상적으로 작동합니다. 그러나 대용량 시스템에서 트랜잭션 잠금 및 빈번한 업데이트 작업으로 인한 오버헤드는 데이터베이스 성능, 응답성 및 확장성 제한에 영향을 미칠 수 있습니다.

이벤트 소싱은 데이터를 캡처하는 다른 접근 방식을 사용합니다. 데이터에 영향을 주는 각 작업은 이벤트 저장소에 유지됩니다. 데이터 레코드의 상태를 업데이트하는 대신, 회계사의 원장과 유사한 과거 이벤트의 순차적 목록에 각 변경 사항을 추가합니다. 이벤트 저장소는 데이터의 레코드 시스템이 됩니다. 마이크로 서비스의 제한된 컨텍스트 내에서 다양한 구체화된 뷰를 전파하는 데 사용됩니다. 그림 5.8은 패턴을 보여 줍니다.

이벤트 소싱

그림 5-8. 이벤트 소싱

이전 그림에서는 사용자의 쇼핑 카트에 대한 각 항목(파란색)이 기본 이벤트 저장소에 추가되는 방식을 확인합니다. 인접한 구체화된 보기에서 시스템은 각 쇼핑 카트와 연결된 모든 이벤트를 재생하여 현재 상태를 투영합니다. 이 보기 또는 읽기 모델은 UI에 다시 노출됩니다. 이벤트를 외부 시스템 및 애플리케이션과 통합하거나 쿼리하여 엔터티의 현재 상태를 확인할 수도 있습니다. 이 방법을 사용하면 기록을 유지 관리합니다. 엔터티의 현재 상태뿐만 아니라 이 상태에 도달한 방법도 알고 있습니다.

기계적으로 말하면 이벤트 소싱은 쓰기 모델을 간소화합니다. 업데이트 또는 삭제가 없습니다. 각 데이터 항목을 변경할 수 없는 이벤트로 추가하면 관계형 데이터베이스와 관련된 경합, 잠금 및 동시성 충돌이 최소화됩니다. 구체화된 뷰 패턴을 사용하여 읽기 모델을 빌드하면 쓰기 모델에서 뷰를 분리하고 애플리케이션 UI의 요구 사항을 최적화하는 데 가장 적합한 데이터 저장소를 선택할 수 있습니다.

이 패턴의 경우 이벤트 소싱을 직접 지원하는 데이터 저장소를 고려합니다. Azure Cosmos DB, MongoDB, Cassandra, CouchDB 및 RavenDB가 적합한 후보입니다.

모든 패턴 및 기술과 마찬가지로 전략적으로 그리고 필요할 때 구현합니다. 이벤트 소싱은 성능과 확장성을 높일 수 있지만 복잡성과 학습 곡선을 희생합니다.

이전 다음

피드백

이 페이지가 도움이 되었나요?

Last updated on 2025-06-17

클라우드 네이티브 데이터 패턴

마이크로 서비스당 데이터베이스, 그 이유는 무엇인가요?

서비스 간 쿼리

분산 트랜잭션

대용량 데이터

CQRS

이벤트 소싱

피드백

추가 리소스