Získání streamovaných dat do Lakehouse a přístup pomocí koncového bodu SQL

Tento rychlý start vysvětluje, jak vytvořit definici úlohy Sparku, která obsahuje kód Pythonu se strukturovaným streamováním Sparku pro umístění dat v lakehouse a jejich následné poskytování prostřednictvím koncového bodu SQL. Po dokončení tohoto rychlého startu budete mít definici úlohy Sparku, která běží nepřetržitě a koncový bod SQL může zobrazit příchozí data.

Důležité

Microsoft Fabric je ve verzi Preview.

Vytvoření skriptu Pythonu

  1. K získání dat v tabulce Lakehouse použijte následující kód Pythonu, který používá strukturované streamování Sparku.

    Snímek obrazovky se skriptem Pythonu

  2. Uložte skript jako soubor Pythonu (.py) v místním počítači.

Vytvoření lakehouse

Pomocí následujícího postupu vytvořte lakehouse:

  1. V Microsoft Fabric vyberte Datové Inženýrství prostředí Synapse.

  2. Přejděte do požadovaného pracovního prostoru nebo v případě potřeby vytvořte nový.

  3. Pokud chcete vytvořit lakehouse, vyberte ikonu Lakehouse v části Nový v hlavním podokně.

    Snímek obrazovky s dialogovým oknem Nový lakehouse

  4. Zadejte název vašeho lakehouse a vyberte Vytvořit.

Vytvoření definice úlohy Sparku

Pomocí následujících kroků vytvořte definici úlohy Sparku:

  1. Ve stejném pracovním prostoru, ve kterém jste vytvořili lakehouse, vyberte v nabídce vlevo ikonu Vytvořit .

  2. V části "Datové Inženýrství" vyberte Definice úlohy Sparku.

    Snímek obrazovky s dialogovým oknem Definice nové úlohy Sparku

  3. Zadejte název definice úlohy Sparku a vyberte Vytvořit.

  4. Vyberte Nahrát a vyberte soubor Pythonu, který jste vytvořili v předchozím kroku.

  5. V části Odkaz na Lakehouse vyberte lakehouse, který jste vytvořili.

Nastavení zásad opakování pro definici úlohy Sparku

Pomocí následujícího postupu nastavte zásadu opakování pro definici úlohy Sparku:

  1. V horní nabídce vyberte ikonu Nastavení .

    Snímek obrazovky s ikonou nastavení definice úlohy Sparku

  2. Otevřete kartu Optimalizace a nastavte aktivační událost zásad opakovánína Zapnuto.

    Snímek obrazovky znázorňující kartu Optimalizace definice úlohy Sparku

  3. Definujte maximální počet opakovaných pokusů nebo zaškrtněte políčko Povolit neomezené pokusy.

  4. Zadejte čas mezi každým opakovaným pokusem a vyberte Použít.

Spuštění a monitorování definice úlohy Sparku

  1. V horní nabídce vyberte ikonu Spustit .

    Snímek obrazovky zobrazující ikonu spuštění definice úlohy Sparku

  2. Ověřte, jestli se definice úlohy Sparku úspěšně odeslala a je spuštěná.

Zobrazení dat pomocí koncového bodu SQL

  1. V zobrazení pracovního prostoru vyberte svůj Lakehouse.

  2. V pravém rohu vyberte Lakehouse a vyberte Koncový bod SQL.

  3. V zobrazení koncového bodu SQL v části Tabulky vyberte tabulku, kterou váš skript používá k získání dat. Potom můžete zobrazit náhled dat z koncového bodu SQL.

Další kroky