PostgreSQL için Azure Cosmos DB'de tabloları dağıtma ve değiştirme

Şunlara uygulanır: ✅ PostgreSQL

Önemli

PostgreSQL için Azure Cosmos DB artık yeni projeler için desteklenmemektedir. Bu hizmeti yeni projeler için kullanmayın. Bunun yerine, şu iki hizmetlerden birini kullanın:

99,999% kullanılabilirlik hizmet düzeyi sözleşmesi (SLA), anında otomatik ölçeklendirme ve birden çok bölgede otomatik yük devretme ile yüksek ölçekli senaryolar için tasarlanmış dağıtılmış bir veritabanı çözümü için NoSQL için Azure Cosmos DB kullanın.
Açık kaynak Citus uzantısını kullanarak bölümlenmiş Azure Veritabanı'nın PostgreSQL için Elastik Kümeler özelliğini kullanın.

Tabloları dağıtmak

Dağıtılmış tablo oluşturmak için önce tablo şemasını tanımlamanız gerekir. Bunu yapmak için CREATE TABLE deyimini kullanarak, normal PostgreSQL tablosuyla yaptığınız gibi bir tablo tanımlayabilirsiniz.

CREATE TABLE github_events
(
    event_id bigint,
    event_type text,
    event_public boolean,
    repo_id bigint,
    payload jsonb,
    repo jsonb,
    actor jsonb,
    org jsonb,
    created_at timestamp
);

Ardından, tablo dağıtım sütununu belirtmek ve çalışan parçalarını oluşturmak için create_distributed_table() işlevini kullanabilirsiniz.

SELECT create_distributed_table('github_events', 'repo_id');

İşlev çağrısı PostgreSQL için Azure Cosmos DB'ye github_events tablosunun repo_id sütununa dağıtılması gerektiğini bildirir (sütun değerini karmalayarak).

Varsayılan olarak toplam 32 parça oluşturur; burada her parça karma alanın bir bölümüne sahip olur ve varsayılan citus.shard_replication_factor yapılandırma değerine göre çoğaltılır. İşçide oluşturulan parça replikaları, koordinatördeki tabloyla aynı tablo şemasına, indeks ve kısıtlama tanımlarına sahiptir. Çoğaltmalar oluşturulduktan sonra işlev tüm dağıtılmış meta verileri koordinatöre kaydeder.

Oluşturulan her parçaya benzersiz bir parça kimliği atanır ve tüm çoğaltmaları aynı parça kimliğine sahiptir. Parçalar çalışan düğümünde 'tablename_shardid' adlı normal PostgreSQL tabloları olarak gösterilir; burada tablo adı dağıtılmış tablonun adı, parça kimliği ise atanan benzersiz kimliktir. Tek tek parçalar üzerinde komutları görüntülemek veya çalıştırmak için çalışan postgres örneklerine bağlanabilirsiniz.

Artık dağıtılmış tabloya veri eklemeye ve üzerinde sorgu çalıştırmaya hazırsınız. Ayrıca tablo ve shard DDL başvurusunda bu bölümde kullanılan kullanıcı tanımlı işlev (UDF) hakkında daha fazla bilgi edinebilirsiniz.

Başvuru Tabloları

Önceki yöntem tabloları birden çok yatay parçaya dağıtır. Başka bir olasılık da tabloları tek bir parçaya ayırmak ve ardından bu parçayı her bir çalışan düğüme çoğaltmaktır. Bu şekilde dağıtılan tablolara başvuru tabloları adı verilir. Bunlar, bir kümedeki birden çok düğüm tarafından sık erişilmesi gereken verileri depolamak için kullanılır.

Başvuru tabloları için yaygın adaylar şunlardır:

Daha küçük tabloların, daha büyük dağıtılmış tablolarla birleştirilmesi gerekiyor.
Çok kiracılı uygulamalarda kiracı kimliği sütunu olmayan veya kiracıyla ilişkilendirilmeyen tablolar. (Ya da geçiş işlemi sırasında, bir kiracıyla ilişkilendirilmiş bazı tablolar için bile.)
Birden çok sütunda benzersiz kısıtlamalara ihtiyaç duyan ve yeterince küçük olan tablolar.

Örneğin, çok kiracılı bir e-ticaret sitesinin mağazalarından herhangi birindeki işlemler için satış vergisini hesaplaması gerektiğini varsayalım. Vergi bilgileri herhangi bir kiracıya özgü değildir. Paylaşılan bir tabloya koymak mantıklıdır. ABD merkezli bir referans tablosu şöyle görünebilir:

-- a reference table

CREATE TABLE states (
  code char(2) PRIMARY KEY,
  full_name text NOT NULL,
  general_sales_tax numeric(4,3)
);

-- distribute it to all workers

SELECT create_reference_table('states');

Artık bir alışveriş sepeti için vergi hesaplama gibi sorgular ağ yükü olmadan tabloya states katılabilir ve daha iyi doğrulama için eyalet koduna yabancı anahtar ekleyebilir.

UDF, PostgreSQL için Azure Cosmos DB meta veri tablolarında tabloyu bir başvuru tablosu olarak işaretlemenin yanı sıra, bir tabloyu tek bir çoğaltılmış parça olarak dağıtır. PostgreSQL için Azure Cosmos DB, bu şekilde işaretlenmiş tablolarda yapılan değişiklikler için otomatik olarak iki aşamalı işlemeler (2PC) gerçekleştirir ve bu da güçlü tutarlılık garantileri sağlar.

Başvuru tablolarını kullanmanın başka bir örneği için çok kiracılı veritabanı kılavuzuna bakın.

Koordinatör Verilerini Dağıtma

Mevcut bir PostgreSQL veritabanı bir kümenin koordinatör düğümüne dönüştürülürse, tablolarındaki veriler verimli bir şekilde ve uygulamada en az kesintiyle dağıtılabilir.

Daha create_distributed_table önce açıklanan işlev hem boş hem de boş olmayan tablolarda çalışır ve ikincisi için tablo satırlarını kümenin tamamında otomatik olarak dağıtır. "BİlDİrİm: Yerel tablodan veri kopyalama..." iletisinin varlığıyla verileri kopyalayıp kopyalamadığı konusunda bilginiz vardır. Mesela:

CREATE TABLE series AS SELECT i FROM generate_series(1,1000000) i;
SELECT create_distributed_table('series', 'i');
NOTICE:  Copying data from local table...
 create_distributed_table
 --------------------------

 (1 row)

Veriler geçirilirken tablodaki yazma işlemleri engellenir ve işlev işlendikten sonra bekleyen yazma işlemleri dağıtılmış sorgular olarak işlenir. (İşlev başarısız olursa sorgular yeniden yerel hale gelir.) Okuma işlemleri normal şekilde devam edebilir ve işlev işlendikten sonra dağıtılmış sorgulara dönüşür.

A'nın B'ye yabancı anahtarı olan A ve B tablolarını dağıtırken, önce anahtar hedef tablosunu B'ye dağıtın. Yanlış sırada yapmak hataya neden olur:

ERROR:  cannot create foreign key constraint
DETAIL:  Referenced table must be a distributed table or a reference table.

Doğru sırada dağıtmak mümkün değilse yabancı anahtarları bırakın, tabloları dağıtın ve yabancı anahtarları yeniden oluşturun.

Amazon RDS'den PostgreSQL için Azure Cosmos DB gibi bir dış veritabanından veri geçirirken, önce aracılığıyla create_distributed_tablePostgreSQL için Azure Cosmos DB dağıtılmış tablolarını oluşturun ve ardından verileri tabloya kopyalayın. Dağıtılmış tablolara kopyalama, koordinatör düğümünde yer dolmasını önler.

Tabloları yan yana yerleştirme

Birlikte bulundurma, ilgili bilgilerin aynı makinelerde tutulması anlamına gelir. Veri kümesinin tamamı için yatay ölçeklenebilirlikten yararlanırken verimli sorgular sağlar. Daha fazla bilgi için kolokasyon'a bakınız.

Tablolar gruplar halinde konumlandırılır. Tablonun birlikte bulundurma grubu atamasını el ile denetlemek için isteğe bağlı colocate_with parametresini create_distributed_tablekullanın. Bir tablonun birlikte konumlandırılmasını umursamıyorsanız bu parametreyi göz ardı edin. Varsayılan olarak değerini kullanır. Bu değer 'default', tabloyu aynı dağıtım sütunu türüne, parça sayısına ve çoğaltma faktörüne sahip olan diğer bir varsayılan birlikte bulundurma tablosuyla gruplandırır. Bu örtük birlikte bulundurmayı kesmek veya güncelleştirmek istiyorsanız kullanabilirsiniz update_distributed_table_colocation().

-- these tables are implicitly co-located by using the same
-- distribution column type and shard count with the default
-- co-location group

SELECT create_distributed_table('A', 'some_int_col');
SELECT create_distributed_table('B', 'other_int_col');

Yeni bir tablo örtük birlikte bulundurma grubundaki diğerleriyle ilgili değilse belirtin colocated_with => 'none'.

-- not co-located with other tables

SELECT create_distributed_table('A', 'foo', colocate_with => 'none');

İlişkisiz tabloları kendi ortak konum gruplarına bölmek parça yeniden dengeleme performansını artırır çünkü aynı gruptaki parçaların birlikte taşınması gerekir.

Tablolar gerçekten ilişkili olduğunda (örneğin, birleştirildiğinde), bunları açıkça aynı yerde konumlandırmak mantıklı olabilir. Uygun ortak yerleşimin faydaları, yeniden dengelemenin getirdiği ek yüklerden daha önemlidir.

Birden çok tabloyu açıkça birlikte yerleştirmek için, birini dağıtın ve diğerlerini onun yerleştirme grubuna koyun. Örneğin:

-- distribute stores
SELECT create_distributed_table('stores', 'store_id');

-- add to the same group as stores
SELECT create_distributed_table('orders', 'store_id', colocate_with => 'stores');
SELECT create_distributed_table('products', 'store_id', colocate_with => 'stores');

Birlikte bulundurma grupları hakkındaki bilgiler pg_dist_colocation tablosunda depolanırken , pg_dist_partition hangi gruplara hangi tabloların atandığı ortaya çıkar.

Tabloları silme

Dağıtılmış tablolarınızı kaldırmak için standart PostgreSQL DROP TABLE komutunu kullanabilirsiniz. Normal tablolarda olduğu gibi DROP TABLE da hedef tablo için var olan tüm dizinleri, kuralları, tetikleyicileri ve kısıtlamaları kaldırır. Ayrıca, parçaları çalışan düğümler üzerine dağıtır ve meta verilerini temizler.

DROP TABLE github_events;

Tabloları değiştirme

PostgreSQL için Azure Cosmos DB, birçok tür DDL deyimini otomatik olarak iletir. Koordinatör düğümünde dağıtılmış bir tabloyu değiştirmek, çalışanlardaki parçaları da güncelleştirir. Diğer DDL deyimleri el ile yayılma gerektirir ve dağıtım sütununu değiştirebilenler gibi bazı diğer deyimler yasaktır. Otomatik yayma için uygun olmayan DDL'yi çalıştırma girişimi bir hataya neden olur ve koordinatör düğümündeki tabloları değişmeden bırakır.

İşte yayılan DDL deyimlerinin kategorilerine dair bir başvuru.

Sütunları Ekleme/Değiştirme

PostgreSQL için Azure Cosmos DB, ALTER TABLE komutlarının çoğunu otomatik olarak uygular. Tek makineli PostgreSQL veritabanında olduğu gibi sütunları ekleme veya varsayılan değerlerini değiştirme işlemleri şöyle çalışır:

-- Adding a column

ALTER TABLE products ADD COLUMN description text;

-- Changing default value

ALTER TABLE products ALTER COLUMN price SET DEFAULT 7.77;

Var olan bir sütunda yeniden adlandırma veya veri türünü değiştirme gibi önemli değişiklikler de uygundur. Ancak dağıtım sütununun veri türü değiştirilemez. Bu sütun, tablo verilerinin kümeye nasıl dağıtacağını belirler ve veri türünü değiştirmek için verilerin taşınması gerekir.

Bunu yapmak bir hataya neden olur:

-- assumining store_id is the distribution column
-- for products, and that it has type integer

ALTER TABLE products
ALTER COLUMN store_id TYPE text;

/*
ERROR:  XX000: cannot execute ALTER TABLE command involving partition column
LOCATION:  ErrorIfUnsupportedAlterTableStmt, multi_utility.c:2150
*/

Kısıtlamaları Ekleme/Kaldırma

PostgreSQL için Azure Cosmos DB'yi kullanmak, veritabanı kısıtlamaları da dahil olmak üzere ilişkisel bir veritabanının güvenliğinin keyfini çıkarmaya devam etmenizi sağlar (bkz. PostgreSQL belgeleri). Dağıtılmış sistemlerin doğası gereği PostgreSQL için Azure Cosmos DB, çalışan düğümleri arasında benzersizlik kısıtlamalarına veya bilgi tutarlılığına çapraz başvuruda bulunamaz.

Birlikte bulunan dağıtılmış tablolar arasında yabancı anahtar ayarlamak için her zaman anahtara dağıtım sütununu ekleyin. Dağıtım sütunu dahil olmak üzere anahtar bileşiminin yapılması gerekebilir.

Yabancı anahtarlar şu durumlarda oluşturulabilir:

iki yerel (dağıtılmamış) tablo arasında,
iki referans tablosu arasında
Anahtarın dağıtım sütununu içerdiği durumlarda, iki aynı konumda bulunan dağıtılmış tablo arasında veya
referans tablosuna atıfta bulunan dağıtılmış tablo olarak

Başvuru tablolarından dağıtılmış tablolara yabancı anahtarlar desteklenmez.

Not

Birincil anahtarlar ve benzersizlik kısıtlamaları dağıtım sütununu içermelidir. Bunları dağıtım dışı bir sütuna eklemek hata oluşturur

Bu örnekte, dağıtılmış tablolarda birincil ve yabancı anahtarların nasıl oluşturulacağı gösterilmektedir:

--
-- Adding a primary key
-- --------------------

-- We'll distribute these tables on the account_id. The ads and clicks
-- tables must use compound keys that include account_id.

ALTER TABLE accounts ADD PRIMARY KEY (id);
ALTER TABLE ads ADD PRIMARY KEY (account_id, id);
ALTER TABLE clicks ADD PRIMARY KEY (account_id, id);

-- Next distribute the tables

SELECT create_distributed_table('accounts', 'id');
SELECT create_distributed_table('ads',      'account_id');
SELECT create_distributed_table('clicks',   'account_id');

--
-- Adding foreign keys
-- -------------------

-- Note that this can happen before or after distribution, as long as
-- there exists a uniqueness constraint on the target column(s) which
-- can only be enforced before distribution.

ALTER TABLE ads ADD CONSTRAINT ads_account_fk
  FOREIGN KEY (account_id) REFERENCES accounts (id);
ALTER TABLE clicks ADD CONSTRAINT clicks_ad_fk
  FOREIGN KEY (account_id, ad_id) REFERENCES ads (account_id, id);

Benzer şekilde, dağıtım sütununu benzersizlik kısıtlamalarına dahil edin:

-- Suppose we want every ad to use a unique image. Notice we can
-- enforce it only per account when we distribute by account id.

ALTER TABLE ads ADD CONSTRAINT ads_unique_image
  UNIQUE (account_id, image_url);

Null olmayan kısıtlamalar, çalışanlar arasında arama gerektirmediğinden herhangi bir sütuna (dağıtım veya değil) uygulanabilir.

ALTER TABLE ads ALTER COLUMN image_url SET NOT NULL;

NOT VALID Kısıtlamaları Kullanma

Bazı durumlarda, mevcut uyumsuz satırların değişmeden kalmasına izin verirken yeni satırlar için kısıtlamaları zorunlu kılmak yararlı olabilir. PostgreSQL için Azure Cosmos DB, PostgreSQL'in "GEÇERSİz DEĞİl" kısıtlama belirlemesini kullanarak CHECK kısıtlamaları ve yabancı anahtarlar için bu özelliği destekler.

Örneğin, kullanıcı profillerini bir başvuru tablosunda depolayan bir uygulamayı düşünün.

-- we're using the "text" column type here, but a real application
-- might use "citext" which is available in a postgres contrib module

CREATE TABLE users ( email text PRIMARY KEY );
SELECT create_reference_table('users');

Zaman içinde birkaç adresi olmayanın tabloya eklendiğini düşünün.

INSERT INTO users VALUES
   ('foo@example.com'), ('hacker12@aol.com'), ('lol');

Adresleri doğrulamak istiyoruz, ancak PostgreSQL normalde mevcut satırlar için başarısız olan bir CHECK kısıtlaması eklememize izin vermez. Ancak geçerli değil olarak işaretlenen bir kısıtlamaya izin verir:

ALTER TABLE users
ADD CONSTRAINT syntactic_email
CHECK (email ~
   '^[a-zA-Z0-9.!#$%&''*+/=?^_`{|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)*$'
) NOT VALID;

Yeni satırlar artık koruma altında.

INSERT INTO users VALUES ('fake');

/*
ERROR:  new row for relation "users_102010" violates
        check constraint "syntactic_email_102010"
DETAIL:  Failing row contains (fake).
*/

Daha sonra yoğun olmayan saatlerde veritabanı yöneticisi hatalı satırları düzeltmeyi ve kısıtlamayı yeniden doğrulamayı dener.

-- later, attempt to validate all rows
ALTER TABLE users
VALIDATE CONSTRAINT syntactic_email;

PostgreSQL belgelerinde ALTER TABLE bölümünde GEÇERSİZ ve KISIT DOĞRULAMA hakkında daha fazla bilgi bulunur.

Dizin Ekleme/Kaldırma

PostgreSQL için Azure Cosmos DB dizin eklemeyi ve kaldırmayı destekler:

-- Adding an index

CREATE INDEX clicked_at_idx ON clicks USING BRIN (clicked_at);

-- Removing an index

DROP INDEX clicked_at_idx;

Dizin eklemek, çok tenantlı bir "kayıt sistemi" içinde istenmeyen bir yazma kilidine neden olur. Uygulamanın kapalı kalma süresini en aza indirmek için bunun yerine dizini eşzamanlı olarak oluşturun. Bu yöntem, standart dizin derlemesinden daha fazla toplam çalışma gerektirir ve tamamlanması daha uzun sürer. Ancak, dizin oluşturulurken normal işlemlerin devam etmesine izin verdiğinden, bu yöntem üretim ortamında yeni dizinler eklemek için kullanışlıdır.

-- Adding an index without locking table writes

CREATE INDEX CONCURRENTLY clicked_at_idx ON clicks USING BRIN (clicked_at);

Türler ve İşlevler

Özel SQL türleri ve kullanıcı tanımlı işlevler oluşturulduğunda, bunlar çalışan düğümlere yayılır. Ancak, dağıtılmış işlemler içeren bir işlemde bu tür veritabanı nesneleri oluşturmak uzlaşmalar gerektirir.

PostgreSQL için Azure Cosmos DB, çalışan başına birden çok bağlantı kullanarak create_distributed_table() gibi işlemleri parçalar arasında paralelleştirir. Bir veritabanı nesnesi oluşturulduğunda, Azure Cosmos DB for PostgreSQL, bunu çalışan düğümlerine her bir çalışan için tek bir bağlantı kullanarak yayar. İki işlemin tek bir işlemde birleştirilmesi sorunlara neden olabilir çünkü paralel bağlantılar tek bir bağlantı üzerinden oluşturulan ancak henüz işlenmeyen nesneyi göremez.

Tür oluşturan, tablo oluşturan, verileri yükleyen ve tabloyu dağıtan bir işlem bloğu düşünün:

BEGIN;

-- type creation over a single connection:
CREATE TYPE coordinates AS (x int, y int);
CREATE TABLE positions (object_id text primary key, position coordinates);

-- data loading thus goes over a single connection:
SELECT create_distributed_table(‘positions’, ‘object_id’);

SET client_encoding TO 'UTF8';
\COPY positions FROM ‘positions.csv’

COMMIT;

Citus 11.0'ın öncesinde Citus, çalışan düğümlerde tür oluşturmayı erteler ve dağıtılmış tabloyu oluştururken ayrı bir işlem olarak tamamlanırdı. Bu, create_distributed_table() içinde veri kopyalamanın paralel olarak gerçekleşmesini sağladı. Ancak, türün Citus çalışan düğümlerinde her zaman mevcut olmadığı anlamına da geliyordu; veya işlem geri alınırsa, tür çalışan düğümlerinde kalacaktı.

Citus 11.0 ile, düzenleyici ve çalışan düğümleri arasındaki şema tutarlılığını önceliklendirmek için varsayılan davranış değişir. Yeni davranışın bir dezavantajı vardır: Nesne yayma işlemi aynı işlemdeki paralel bir komut sonrasında gerçekleşirse, aşağıdaki kod bloğundaki ERROR tarafından vurgulandığı gibi işlem artık tamamlanamaz:

BEGIN;
CREATE TABLE items (key text, value text);
-- parallel data loading:
SELECT create_distributed_table(‘items’, ‘key’);
SET client_encoding TO 'UTF8';
\COPY items FROM ‘items.csv’
CREATE TYPE coordinates AS (x int, y int);

ERROR:  cannot run type command because there was a parallel operation on a distributed table in the transaction

Bu sorunla karşılaşırsanız iki basit geçici çözüm vardır:

Bu durumda türün oluşturulmasını ertelemek için citus.create_object_propagation ayarını automatic olarak kullanın; bu durumda farklı düğümlerde hangi veritabanı nesnelerinin mevcut olduğuna dair bazı tutarsızlıklar olabilir.
Paralellik devre dışı bırakmak için citus.multi_shard_modify_mode'yi sequential olarak ayarlayın. Aynı işlemdeki veri yükü daha yavaş olabilir.

Sonraki adımlar

Yararlı tanılama sorguları

Geri Bildirim

Bu sayfayı yararlı buldunuz mu?

Last updated on 2025-10-30