Přehled knihovny Bulk Executor pro službu Azure Cosmos DB

PLATÍ PRO: NoSQL

Azure Cosmos DB je rychlá, flexibilní a globálně distribuovaná databázová služba, která elasticky škáluje na více instancí a podporuje:

  • Velká propustnost čtení a zápisu v řádu milionů operací za sekundu.
  • Ukládání velkých objemů transakčních a provozních dat v řádu stovek terabajtů nebo i více s předvídatelnou latencí v milisekundách

Knihovna Bulk Executor vám pomůže s využitím této obrovské propustnosti a úložiště. Knihovna Bulk Executor umožňuje provádět ve službě Azure Cosmos DB hromadné operace prostřednictvím rozhraní API pro hromadný import a hromadné aktualizace. Další informace o funkcích knihovny Bulk Executor najdete v následujících částech.

Poznámka

Knihovna Bulk Executor v současné době podporuje operace importu a aktualizace. Rozhraní API služby Azure Cosmos DB podporuje tuto knihovnu pouze pro účty NoSQL a Gremlin.

Důležité

Knihovna Bulk Executor se v současné době nepodporuje u účtů bez serveru . V .NET doporučujeme použít hromadnou podporu dostupnou ve verzi v3 sady SDK.

Klíčové funkce knihovny Bulk Executor

  • Použití knihovny Bulk Executor výrazně snižuje výpočetní prostředky na straně klienta potřebné k nasycení propustnosti přidělené kontejneru. Jednovláknová aplikace, která zapisuje data pomocí rozhraní API pro hromadný import, dosahuje 10krát vyšší propustnosti zápisu v porovnání s aplikací s více vlákny, která zapisuje data paralelně, zatímco saturuje procesor klientského počítače.

  • Knihovna Bulk Executor abstrahuje zdlouhavé úlohy psaní logiky aplikace pro zpracování omezování rychlosti požadavků, vypršení časových limitů požadavků a dalších přechodných výjimek. Efektivně je zpracovává v rámci knihovny.

  • Poskytuje zjednodušený mechanismus, který aplikacím umožňuje provádět hromadné operace pro horizontální navýšení kapacity. Jedna instance bulk executoru, která běží na virtuálním počítači Azure, může spotřebovat více než 500 tisíc RU/s. Vyšší propustnosti můžete dosáhnout přidáním dalších instancí na jednotlivých klientských virtuálních počítačích.

  • Knihovna Bulk Executor může pomocí architektury se škálováním na více instancí hromadně importovat více než terabajt dat během jedné hodiny.

  • Může hromadně aktualizovat existující data v kontejnerech Azure Cosmos DB jako opravy.

Jak funguje bulk executor?

Když se hromadná operace importu nebo aktualizace dokumentů aktivuje pomocí dávky entit, tyto entity se nejprve promíchají do kontejnerů, které odpovídají rozsahu klíčů oddílů služby Azure Cosmos DB. V každém kbelíku, který odpovídá rozsahu klíčů oddílu, jsou rozdělené do minidávek.

Každá minidávka funguje jako datová část, která je potvrzena na straně serveru. Knihovna Bulk Executor obsahuje integrované optimalizace pro souběžné spouštění minidávek v rámci i napříč rozsahy klíčů oddílů.

Následující diagram znázorňuje, jak hromadný exekutor rozděluje data do různých klíčů oddílů:

Diagram znázorňuje architekturu bulk executoru.

Knihovna Bulk Executor zajišťuje maximální využití propustnosti přidělené kolekci. Používá mechanismus řízení zahlcení ve stylu AIMD pro každý rozsah klíčů oddílů služby Azure Cosmos DB k efektivnímu zpracování omezování rychlosti a vypršení časových limitů.

Další informace o ukázkových aplikacích, které využívají knihovnu Bulk Executor, najdete v tématech Použití knihovny Bulk Executor .NET k provádění hromadných operací ve službě Azure Cosmos DB a Provádění hromadných operací s daty služby Azure Cosmos DB.

Referenční informace najdete v tématech Knihovna Bulk Executor pro .NET a Knihovna Bulk Executor jazyka Java.

Další kroky