Clustery

Cluster Azure Databricks je sada výpočetních prostředků a konfigurací, na kterých se provozují úlohy přípravy dat, datových věd a analýzy dat, jako jsou produkční kanály extrakce, transformace a načítání, analýzy streamování, ad hoc analýzy a strojové učení.

Tyto úlohy se spouští jako sada příkazů v poznámkovém bloku nebo jako automatizovaná úloha. Azure Databricks rozlišuje mezi clustery pro obecné účely a clustery úlohy. Clustery pro obecné účely se používají ke spolupráci při analýze dat pomocí interaktivních poznámkových bloků. Clustery úlohy se používají k provozování rychlých a robustních automatizovaných úloh.

  • Cluster pro obecné účely můžete vytvořit pomocí uživatelského rozhraní, rozhraní příkazového řádku nebo rozhraní REST API. Cluster pro obecné účely můžete ručně ukončit a restartovat. Takové clustery mohou být sdíleny mezi několika uživateli, kteří spolupracují na interaktivní analýze.
  • Plánovač úloh Azure Databricks vytvoří cluster úloh , když spustíte úlohu v novém clusteru úloh a po dokončení úlohy cluster ukončí. Cluster úlohy nelze restartovat.

Tato část popisuje, jak pracovat s úlohami pomocí uživatelského rozhraní. Další metody najdete v tématu Rozhraní příkazového řádku clusterů a rozhraní API clusterů 2.0.

Tato část se zaměřuje spíše na clustery pro obecné účely než clustery úlohy, i když se mnohé z popsaných nástrojů pro konfiguraci a správu vztahují na oba typy clusterů. Další informace o vytváření clusterů úloh najdete v tématu Vytvoření, spuštění a správa úloh Azure Databricks.

Důležité

Azure Databricks uchovává informace o konfiguraci clusteru až pro 200 clusterů pro všechny účely ukončených za posledních 30 dnů a až 30 clusterů úloh nedávno ukončených plánovačem úloh. Pokud chcete konfiguraci clusteru pro obecné účely zachovat déle než 30 dnů po jeho ukončení, může správce připnout cluster do seznamu clusterů.

V této části: