Jaa


Pikaopas: Tietotyönkulun luominen

Muistiinpano

Tietojen työnkulut toimii Apache Airflow'lla.
Apache Airflow on avoimen lähdekoodin ympäristö, jolla voit ohjelmallisesti luoda, ajoittaa ja valvoa monimutkaisia tietotyönkulkuja. Sen avulla voit määrittää joukon tehtäviä, joita kutsutaan operaattoreiksi ja jotka voidaan yhdistää suunnattuihin asyklisiin kuvaajiin (DAG), jotka edustavat tietoputkia.

Tietotyönkulut tarjoavat yksinkertaisen ja tehokkaan tavan luoda ja hallita Apache Airflow -ympäristöjä, joiden avulla voit suorittaa tietotyönkulkuja skaalautuvasti. Tässä pikaoppaassa luot ensimmäisen tietotyönkulun ja suoritat DAG(Directed Acyclic Graph) -kaavion, jotta voit tutustua tietotyönkulkujen ympäristöön ja toimintoihin.

Edellytykset

  • Ota tietotyönkulut käyttöön vuokraajassasi.

Muistiinpano

Koska tietojen työnkulut ovat esikatselutilassa, sinun on otettava ne käyttöön vuokraajan järjestelmänvalvojan kautta. Jos näet jo Tietotyönkulut-kohdan, vuokraajasi järjestelmänvalvoja on saattanut jo ottaa sen käyttöön.

  1. Siirry kohtaan Hallintaportaali -> Vuokraaja-asetukset –> Laajenna Microsoft Fabric -> Laajenna "Käyttäjät voivat luoda ja käyttää tietotyönkulkuja (esikatselu)" -osio.
  2. Valitse Käytä.

Näyttökuva Apache Airflow'n käyttöönottamiseksi vuokraajassa.

Tietotyönkulun luominen

  1. Voit käyttää aiemmin luotua työtilaa tai luoda uuden työtilan.

  2. Laajenna-valikko + New -> Napsauta Lisää vaihtoehtoja –> Kohdassa Data Factory -> Valitse tietotyönkulut (esikatselu)

    Näyttökuvassa näkyy lisää vaihtoehtoja napsauttamalla.

    Näyttökuva tietotyönkulun valitsemiseksi.

  3. Anna projektillesi sopiva nimi ja napsauta Luo-painiketta.

DAG-tiedoston luominen

  1. Napsauta "Uusi DAG-tiedosto" -korttia -> anna tiedostolle nimi ja napsauta "Luo"-painiketta.

    Näyttökuva DAG-tiedoston nimeksi.

  2. DAG-kattilakoodi näytetään sinulle. Voit muokata tiedostoa tarpeidesi mukaan.

    Näyttökuva esittää DAG-tiedoston kattilassa Microsoft Fabricissa.

  3. Napsauta "Tallenna-kuvake".

    Näyttökuvassa esitetään DAG-tiedoston tallentaminen Microsoft Fabricissa.

DAG:n suorittaminen

  1. Aloita napsauttamalla "Suorita DAG" -painiketta.

    Näyttökuva DAG:n suorittamiseen tietojen työnkulkujen käyttöliittymästä.

  2. Kun raportti on käynnistetty, näkyviin tulee heti ilmoitus, joka ilmaisee DAG:n olevan käynnissä.

  3. Jos haluat seurata DAG-suorituksen edistymistä, napsauta ilmoituskeskuksen Näytä tiedot -painiketta. Tämä toiminto ohjaa sinut Apache Airflow -käyttöliittymään, jossa voit kätevästi seurata DAG-suorituksen tilaa ja tietoja.

    Näyttökuva, jossa voit siirtyä ilmoituskeskuksesta Apache Airflow -käyttöliittymään.

Tietotyönkulun DAG:n valvonta Apache Airflow -käyttöliittymässä

Tallennetut dag-tiedostot ladataan Apache Airflow -käyttöliittymään. Voit valvoa niitä napsauttamalla "Monitor in Apache Airflow" -painiketta.

Näyttökuva, joka valvoo Airflow DAG -mittaria.

Näyttökuvassa näkyy ladattu airflow-DAG.