Sdílet prostřednictvím


Porovnání režimů detekce souborů automatického zavaděče

Automatický zavaděč podporuje dva režimy pro detekci nových souborů: výpis adresáře a oznámení o souborech. Režimy zjišťování souborů můžete přepínat mezi restartováními datových proudů a stále získat záruky zpracování dat přesně jednou.

Režim výpisu adresáře

V režimu výpisu adresáře automaticky zavaděč identifikuje nové soubory výpisem vstupního adresáře. Režim výpisu adresáře umožňuje rychle spustit streamy automatického zavaděče bez jakýchkoli konfigurací oprávnění, než je přístup k datům v cloudovém úložišti.

Ve službě Databricks Runtime 9.1 a novějších může Auto Loader automaticky zjistit, jestli soubory přicházejí s lexikálním řazením do cloudového úložiště, a výrazně snížit množství volání rozhraní API potřebných k detekci nových souborů. Další podrobnosti najdete v tématu Co je režim výpisu adresáře automatického zavaděče?

Režim oznámení souboru

Režim oznámení souborů využívá služby oznámení souborů a front v účtu cloudové infrastruktury. Automatický zavaděč může automaticky nastavit službu oznámení a službu fronty, které se přihlásí k odběru událostí souborů ze vstupního adresáře.

Režim oznámení souborů je výkonnější a škálovatelný pro velké vstupní adresáře nebo velký objem souborů, ale k nastavení vyžaduje další cloudová oprávnění. Další informace naleznete v tématu Co je režim oznámení souboru automatického zavaděče?.

Cloudové úložiště podporované režimy

Dostupnost těchto režimů je uvedená níže.

Pokud migrujete z externího umístění nebo dbFS připojení ke svazku katalogu Unity, automatický zavaděč bude dál poskytovat záruky přesně jednou.

Cloudové úložiště Výpis adresáře Oznámení o souborech
AWS S3 Všechny verze Všechny verze
ADLS Gen2 Všechny verze Všechny verze
GCS Všechny verze Databricks Runtime 9.1 a novější
Azure Blob Storage Všechny verze Všechny verze
ADLS Gen1 Všechny verze Nepodporované
DBFS Všechny verze Pouze pro přípojné body
Svazek katalogu Unity Databricks Runtime 13.3 LTS a vyšší Nepodporovaný