Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu öğreticiler, Fabric veri bilimi deneyiminde eksiksiz bir uçtan uca senaryo sunar. Onlar, her adımı kapsıyor
- Veri alımı
- Verileri temizleme
- Veri hazırlama
için
- Makine öğrenmesi modeli eğitimi
- İçgörü oluşturma
ve ardından görselleştirme araçlarıyla (örneğin, Power BI) bu içgörülerin tüketimini ele alın.
Microsoft Fabric'i yeni kullanmaya yeni gelen kişiler Microsoft Fabric nedir? adresini ziyaret etmelidir.
Giriş
Veri bilimi projesi yaşam döngüsü genellikle şu adımları içerir:
- İş kurallarını anlama
- Verileri alma
- Verileri keşfetme, temizleme, hazırlama ve görselleştirme
- Modeli eğitin ve denemeyi izleyin
- Modeli puanlayın ve içgörüler oluşturun
Adımlar genellikle yinelemeli olarak devam eder. Her aşamanın hedefleri ve başarı ölçütleri işbirliğine, veri paylaşımına ve belgelere bağlıdır. Doku veri bilimi deneyimi sorunsuz işbirliği, veri alımı, paylaşım ve tüketim sağlayan yerel olarak oluşturulmuş birden çok özellik içerir.
Bu öğreticiler sizi 10.000 banka müşterisinin değişim durumunu içeren bir veri kümesini keşfetmesi, temizlemesi ve dönüştürmesi gereken bir veri bilimcisi rolüne yerleştirir. Ardından, hangi banka müşterilerinin ayrılacağını tahmin etmek için bir makine öğrenmesi modeli oluşturursunuz.
Kılavuzlarda aşağıdaki etkinlikleri gerçekleştirirsiniz:
- Veri bilimi senaryoları için Fabric not defterlerini kullanın
- Fabric lakehouse'a veri almak için Apache Spark kullanın
- Göl veri deposu delta tablolarından mevcut verileri yükleme
- Verileri temizlemek ve dönüştürmek için Apache Spark ve Python tabanlı araçları kullanma
- Farklı makine öğrenmesi modellerini eğitmek için denemeler ve çalıştırmalar oluşturma
- Eğitim modellerini kaydetmek ve izlemek için MLflow ve Fabric UI'yi kullanın.
- Büyük ölçekte puanlama çalıştırın ve tahminleri ve çıkarım sonuçlarını lakehouse'a kaydedin
- Power BI'da tahminleri görselleştirmek için DirectLake kullanma
Mimarlık
Bu öğretici serisi, aşağıdakileri içeren basitleştirilmiş bir uçtan uca veri bilimi senaryosunu gösterir:
- Dış veri kaynağından veri alımı.
- Veri keşfi ve temizleme.
- Makine öğrenmesi modeli eğitimi ve kaydı.
- Toplu skorlama ve tahmin kaydetme.
- Power BI'da tahmin sonucu görselleştirmesi.
Veri bilimi senaryosunun farklı bileşenleri
Veri kaynakları - Azure Veri Hizmetleri, diğer bulut platformları ve şirket içi veri kaynakları ile hızlı ve kolay bir bağlantı kurarak, Fabric üzerinden veri alabilirsiniz. Fabric Not Defterleri ile şu kaynaklardan veri alabilirsiniz:
- Dahili Göl Evleri
- Veri Ambarları
- Anlamsal modeller
- Çeşitli Apache Spark veri kaynakları
- Python'i destekleyen çeşitli veri kaynakları
Bu öğretici serisi, bir göl evinden veri alımına ve yüklenmesine odaklanır.
Keşfedin, temizleyin ve hazırlayın - Doku veri bilimi deneyimi veri temizleme, dönüştürme, araştırma ve özellik geliştirmeyi destekler. Data Wrangler ve SemPy Kitaplığı gibi yerleşik Spark deneyimlerini ve Python tabanlı araçları kullanır. Bu öğreticide Python kitaplığıyla seaborn
veri keşfi ve Apache Spark ile veri temizleme ve hazırlama işlemleri gösterilir.
Modeller ve deneyler - Fabric ile entegre deneylerle makine öğrenmesi modellerini eğitebilir, değerlendirebilir ve puanlayabilirsiniz. MLflow, modellerinizi kaydetmek ve dağıtmak ile deneyleri izlemek için Fabric ile sorunsuz bir tümleştirme sunarak öğeleri modellemenizi sağlar. İş içgörüleri oluşturmak ve paylaşmak için Fabric, iş içgörüleri oluşturmak ve paylaşmak için uygun ölçekte model tahmini (PREDICT) için başka özellikler de sunar.
Depolama - Fabric, Delta Lake'i standart olarak kullanır, bu da tüm Fabric motorlarının bir lakehouse'ta depolanan aynı veri setiyle etkileşim kurabileceği anlamına gelir. Bu depolama katmanıyla, hem dosya tabanlı depolamayı hem de tablosal biçimi destekleyen hem yapılandırılmış hem de yapılandırılmamış verileri depolayabilirsiniz. Not defterleri ve işlem hatları gibi tüm Doku deneyimi öğeleri aracılığıyla veri kümelerine ve depolanan dosyalara kolayca erişebilirsiniz.
Analiz ve içgörüleri kullanıma sunma - Sektör lideri bir iş zekası aracı olan Power BI, rapor ve görselleştirme oluşturma için lakehouse verilerini kullanabilir. Not defteri kaynakları arasında Python veya Spark yerel görselleştirme kitaplıkları
matplotlib
seaborn
plotly
- vb.
bir göl evinde kalıcı olan verileri görselleştirebilir. SemPy kitaplığı, veri görselleştirmeyi de destekler. Bu kitaplık, yerleşik zengin ve göreve özgü görselleştirmeleri destekler.
- Anlamsal veri modeli
- Bağımlılıklar ve bunların ihlalleri
- Sınıflandırma ve regresyon kullanım örnekleri