Microsoft Fabric'te veri mühendisliği nedir?
Microsoft Fabric'te veri mühendisliği, kullanıcıların kuruluşlarının büyük hacimli verileri toplamasını, depolamasını, işlemesini ve analiz edebilmesini sağlayan altyapılar ve sistemler tasarlamasına, oluşturmasına ve bakımını yapmasına olanak tanır.
Microsoft Fabric, verilerinizin kolayca erişilebilir, iyi düzenlenmiş ve yüksek kaliteli olmasını sağlamak için çeşitli veri mühendisliği özellikleri sağlar. Veri mühendisliği giriş sayfasından şunları yapabilirsiniz:
Lakehouse kullanarak verilerinizi oluşturma ve yönetme
Lakehouse'unuza veri kopyalamak için işlem hatları tasarlama
Spark kümesine toplu iş/akış işi göndermek için Spark iş tanımlarını kullanma
Veri alımı, hazırlama ve dönüştürme için kod yazmak için not defterlerini kullanma
Göl evi
Lakehouses, kuruluşların bu verileri işlemek ve analiz etmek için çeşitli araçlar ve çerçeveler kullanarak yapılandırılmış ve yapılandırılmamış verileri tek bir konumda depolamasına ve yönetmesine olanak sağlayan veri mimarileridir. Bu araçlar ve çerçeveler SQL tabanlı sorgular ve analizlerin yanı sıra makine öğrenmesi ve diğer gelişmiş analiz tekniklerini içerebilir.
Apache Spark iş tanımı
Spark iş tanımları, Spark kümesinde bir işin nasıl yürütüldüğünü tanımlayan yönergeler kümesidir. Giriş ve çıkış veri kaynakları, dönüştürmeler ve Spark uygulamasının yapılandırma ayarları gibi bilgileri içerir. Spark iş tanımı Spark kümesine toplu iş/akış işi göndermenizi, göl evinde barındırılan verilere farklı dönüştürme mantığı uygulamanızı ve diğer birçok şeyi yapmanızı sağlar.
Not Defteri
Not defterleri, kullanıcıların canlı kod, denklemler, görselleştirmeler ve anlatı metni içeren belgeler oluşturmasına ve paylaşmasına olanak tanıyan etkileşimli bir bilgi işlem ortamıdır. Kullanıcıların Python, R ve Scala gibi çeşitli programlama dillerinde kod yazmasına ve yürütmesine olanak sağlar. Not defterlerini veri alımı, hazırlık, analiz ve verilerle ilgili diğer görevler için kullanabilirsiniz.
Veri işlem hattı
Veri işlem hatları, verileri ham biçiminden analiz ve karar alma için kullanabileceğiniz bir biçime toplayan, işleyebilen ve dönüştürebilen bir dizi adımdır. Verileri kaynağından hedefine güvenilir, ölçeklenebilir ve verimli bir şekilde taşımanın bir yolunu sağladığından, veri mühendisliğinin kritik bir bileşenidir.
Doku deneme sürümüne kaydolürken Microsoft Fabric'teki Veri Madenciliği ücretsiz olarak kullanabilirsiniz. Microsoft Fabric kapasitesi veya Fabric ayrılmış kapasitesi de satın alabilirsiniz
İlgili içerik
Veri Madenciliği kullanmaya başlayın:
- Göl evleri hakkında daha fazla bilgi edinmek için bkz . Microsoft Fabric'te göl evi nedir?
- Göl evi kullanmaya başlamak için bkz . Microsoft Fabric'te göl evi oluşturma.
- Apache Spark iş tanımları hakkında daha fazla bilgi edinmek için bkz . Apache Spark iş tanımı nedir?
- Apache Spark iş tanımını kullanmaya başlamak için bkz . Dokuda Apache Spark iş tanımı oluşturma.
- Not defterleri hakkında daha fazla bilgi edinmek için bkz . Not defterini yazma ve yürütme.
- İşlem hattı kopyalama etkinliğini kullanmaya başlamak için bkz . Kopyalama etkinliğini kullanarak veri kopyalama.
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin