Sdílet prostřednictvím


Co je definice úlohy Apache Sparku?

Definice úlohy Apache Sparku je položka kódu Microsoft Fabric, která umožňuje odesílat dávkové a streamované úlohy do clusterů Spark. Nahráním binárních souborů z výstupu kompilace různých jazyků (například .jar z Javy) můžete použít jinou transformační logiku na data hostovaná v jezeře. Kromě binárního souboru můžete chování úlohy dále přizpůsobit tak, že nahrajete další knihovny a argumenty příkazového řádku.

Pokud chcete spustit definici úlohy Sparku, musíte k ní mít přidružené alespoň jedno jezero. Tento výchozí kontext lakehouse slouží jako výchozí systém souborů pro modul runtime Spark. Pro každý kód Sparku, který používá relativní cestu ke čtení a zápisu dat, se data obsluhuje z výchozího jezera.

Tip

Pokud chcete spustit položku definice úlohy Sparku, musíte mít hlavní definiční soubor a výchozí kontext lakehouse. Pokud nemáte jezerní dům, vytvořte ho podle kroků v části Vytvoření jezera.