Osvědčené postupy pro knihovnu Kusto Ingest
Tento článek vysvětluje osvědčené postupy pro příjem dat pomocí knihovny Kusto Ingest.
Preferovat frontu před přímým příjmem dat
V produkčních scénářích použijte klienta ingestování ve frontě. Další informace najdete v tématech Příjem dat ve frontě a Přímý příjem dat.
Použití jedné instance klienta ingestování
Implementace klienta Ingestu Kusto jsou bezpečné pro přístup z více vláken a opakovaně použitelné. Pro každý cílový cluster použijte pro každý proces jednu instanci klienta zařazeného do fronty nebo přímého ingestování. Spuštění více instancí může cluster přetížit, což způsobí, že přestane reagovat nebo zpomalí reagovat na platné požadavky.
Omezit stav operace sledování
V případě velkých datových proudů omezte použití pozitivních oznámení pro žádosti o příjem dat. Nadměrné sledování může vést ke zvýšení latence příjmu dat a dokonce i ke úplné nereagování clusteru. Další informace najdete v tématu Stav operace.
Optimalizace propustnosti
Při plánování kanálu příjmu dat zvažte následující faktory, protože můžou mít významný vliv na propustnost příjmu dat.
Faktor | Description |
---|---|
Velikost dat | Příjem dat je efektivnější, pokud se provádí ve velkých blocích. Doporučujeme odesílat data v dávkách od 100 MB do 1 GB (nekomprimovaná). |
Formát dat | Soubor CSV je nejrychlejším formátem pro příjem dat. U stejného objemu dat může JSON trvat 2krát nebo 3krát déle. Další informace najdete v tématu Formáty dat podporované pro příjem dat. |
Šířka tabulky | Ingestují se jenom základní data. Každý sloupec musí být kódovaný a indexovaný, což znamená, že širší tabulky můžou mít nižší propustnost. Pomocí mapování příjmu dat můžete řídit, která pole se budou ingestovat. |
Umístění zdrojových dat | Pokud chcete zrychlit příjem dat, vyhněte se čtení mezi oblastmi. |
Zatížení clusteru | Když u clusteru dochází k vysokému zatížení dotazů, dokončení příjmu dat trvá déle. |
Poznámka
Klient ingestování ve frontě rozdělí velké datové sady na bloky dat a agreguje je, což je užitečné, když data před příjmem dat nejde zařadit do dávek.
Optimalizace nákladů
Použití klientských knihoven Kusto k příjmu dat do clusteru zůstává nejlevnější a nejrobustnější možností. Apelujeme na naše zákazníky, aby zkontrolovali své metody příjmu dat, aby optimalizovali náklady a využili ceny služby Azure Storage, díky kterým budou transakce objektů blob výrazně nákladově efektivní.
Pro nákladově efektivní příjem dat:
- Omezte počet přijatých datových bloků, jako jsou soubory, objekty blob a streamy.
- Ingestuje velké bloky nekomprimovaných dat o velikosti až 1 GB.
- Vyberte dávkování.
- Zadejte přesnou nekomprimovanou velikost dat, abyste se vyhnuli dodatečným transakcím úložiště.
- Vyhněte se nastavení
FlushImmediately
natrue
. - Vyhněte se odesílání malých objemů dat se značkami
ingest-by
rozsahu nebodrop-by
.
Poznámka
Nadměrné využití posledních dvou metod může narušit agregaci dat, vést k dalším transakcím úložiště a poškodit příjem dat a výkon dotazů.
Související obsah
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro