Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Not
Apache Airflow işi Apache Airflow tarafından desteklenmektedir.
Microsoft Fabric içindeki dönüştürücü bir özellik olan Veri İş Akışları, veri işlem hatlarını oluşturma ve yönetme yaklaşımınızı yeniden tanımlar. Apache Airflow çalışma zamanı tarafından desteklenen Veri İş Akışları, Yönlendirilmiş Döngüsel Grafikler (DAG) olarak ifade edilen Python tabanlı veri iş akışlarını geliştirmek, zamanlamak ve izlemek için tümleşik, bulut tabanlı bir platform sağlar. Apache Airflow kullanarak veri işlem hattı geliştirme ve yönetimi için Hizmet Olarak Yazılım (SaaS) deneyimi sunarak çalışma zamanını kolayca erişilebilir hale getirir ve veri iş akışlarınızın oluşturulmasını ve çalışmasını sağlar.
Veri iş akışlarıyla ilgili olarak, iş akışı dosyalarınızı depolamak için iki seçeneğiniz vardır: Fabric tarafından yönetilen depolama ve GitHub tarafından yönetilen depolama. Bu makalede, kodunuzu mevcut bir GitHub deposundan eşitlemeyi öğreneceksiniz.
Apache Airflow Görevi Oluşturma
Mevcut bir çalışma alanını veya Yeni çalışma alanı oluştur'u kullanabilirsiniz.
Genişlet
+ New
açılır menüsü -> Daha Fazla Seçenek'e tıklayın ->Data Factory
başlığı altında -> Apache Airflow Görevi (önizleme) öğesini seçinProjenize uygun bir ad verin ve "Oluştur" Düğmesine tıklayın.
GitHub deponuzu eşitleme
Apache Airflow İşinizi eşitlemek istediğiniz git deposunu belirtin.
"Ayarlar" düğmesine gidin ve 'Dosya Depolama' sekmesine tıklayın. Depolama türü olarak "Git-sync" öğesini seçin.
Aşağıdaki alanları doldurun:
Git hizmet türü: Desteklenen hizmet türleri:
- GitHub
- ADO: Azure DevOps
- GitLab
- BitBucket
Git Kimlik Bilgisi türü: Desteklenen kimlik bilgisi türleri:
- Hiçbiri: Depo herkese açık olduğunda bu kimlik bilgisi türünü seçin.
- Kişisel Erişim belirteci: Git hizmetinden depoyla kimlik doğrulaması yapmak için kullanılan kişisel erişim belirteci.
- Alanları doldurun:
- Kullanıcı adı: GitHub kullanıcı adı.
- Kişisel Erişim belirteci
- Alanları doldurun:
- Hizmet Sorumlusu: Git Hizmeti'ni Azure Devops olarak seçtiğinizde bu kimlik bilgilerini seçin:
- Alanları doldurun:
- Hizmet sorumlusu uygulama kimliği: Azure Devops Deposu'na erişimi olan Hizmet Sorumlunuzun istemci kimliği.
- Hizmet sorumlusu sırrı: Azure DevOps deposuna erişimi olan istemci sırrı.
- Hizmet sorumlusu kiracı kimliği: Hizmet Sorumlunuzun Kiracı Kimliği.
- Alanları doldurun:
- Depo: Eşitlemek istediğiniz deponun kopya URL'si.
- Dal: Eşitlemek istediğiniz depo dalının adı.
'Uygula'ya tıklayın.
DAG'lerinizi izleme
Deponuzun eşitlenip eşitlenmediğini doğrulamak için "Apache Airflow'da İzle" seçeneğine tıklayarak Apache Airflow'un kullanıcı arabirimine gidin. Kullanıcı arabiriminde deponuzdaki tüm DAG'lerin doğrudan yüklendiğini görürsünüz.
Git-sync depolama alanı kullanılırken kod düzenleyicisi desteklenmez. Kodunuzu yerel olarak düzenlemeniz ve değişiklikleri uzak Git deponuza göndermeniz gerekir. En son işlemeniz Veri İş Akışları ile otomatik olarak eşitlenir ve güncelleştirilmiş kodunuzu Apache Airflow kullanıcı arabiriminde görebilirsiniz.
Desteklenen Git deposu yapısı
|── dags/
| |-- *.py
|-- plugins
| |-- executors/
| | ├-- __init__.py
| | └-- *.py
| |-- hooks/
| | ├-- __init__.py
| | └-- *.py
| |-- operators/
| | ├-- __init__.py
| | └-- *.py
| |-- transfers/
| | ├-- __init__.py
| | └-- *.py
| |-- triggers/
| | ├-- __init__.py
| | └-- *.py
Not
Yalnızca dags
ve plugins
klasörlerini depodan eşitleriz. Tüm dosyaların veya alt klasörlerin bu klasörlerden birinin içinde olduğundan emin olun.