Microsoft Fabric'te Data Wrangler ile veri hazırlığı nasıl hızlandırılabilir?
Data Wrangler, kullanıcılara keşif veri analizi için çevreleyici bir arabirim sağlayan not defteri tabanlı bir araçtır. Bu özellik, kılavuz benzeri bir veri görüntüsünü dinamik özet istatistikleri, yerleşik görselleştirmeler ve yaygın veri temizleme işlemleri kitaplığıyla birleştirir. Her işlem tıklamalar halinde uygulanabilir, veri görüntüsünü gerçek zamanlı olarak güncelleştirebilir ve pandas veya PySpark'ta yeniden kullanılabilir bir işlev olarak not defterine geri kaydedilebilecek kod oluşturulabilir. Bu makale pandas DataFrames'i keşfetmeye ve dönüştürmeye odaklanır. Spark DataFrame'lerde Data Wrangler kullanma yönergelerini burada bulabilirsiniz.
Önkoşullar
Microsoft Fabric aboneliği alın. Alternatif olarak, ücretsiz bir Microsoft Fabric deneme sürümüne kaydolun.
Synapse Veri Bilimi deneyimine geçmek için giriş sayfanızın sol tarafındaki deneyim değiştiriciyi kullanın.
Sınırlamalar
- Data Wrangler şu anda genel kullanılabilirlik aşamasında pandas kod oluşturmayı ve genel önizlemede Spark kod oluşturmayı desteklemektedir.
- Özel kod işlemleri şu anda yalnızca pandas DataFrames için desteklenmektedir.
- Data Wrangler'ın ekranı büyük monitörlerde en iyi şekilde çalışır, ancak arabirimin farklı bölümleri daha küçük ekranlara uyum sağlamak için simge durumuna küçültülebilir veya gizlenebilir.
Veri Wrangler'ı başlatma
Tüm pandaları veya Spark DataFrame'i keşfetmek ve dönüştürmek için Data Wrangler'ı doğrudan bir Microsoft Fabric not defterinden başlatabilirsiniz. Data Wrangler'ı Spark DataFrames ile kullanmaya genel bakış için lütfen bu yardımcı makaleye bakın. Aşağıdaki kod parçacığında pandas DataFrame'de örnek verilerin nasıl okunduğu gösterilmektedir:
import pandas as pd
# Read a CSV into a Pandas DataFrame
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")
display(df)
Not defteri şeridi "Veri" sekmesinin altında, düzenleme için kullanılabilen etkin DataFrame'lere göz atmak için Veri Wrangler açılan istemini kullanın. Data Wrangler'da açmak istediğiniz dosyayı seçin.
İpucu
Not defteri çekirdeği meşgulken veri Wrangler açılamaz. Yürütülen bir hücre, Data Wrangler'ın başlatılabilmesi için önce yürütülmesini tamamlamalıdır.
Özel örnekler seçme
Data Wrangler, açılan listeden "Özel örnek seç" seçeneğini belirleyerek herhangi bir etkin DataFrame'in özel örneğini açmanıza olanak tanır. Bunu yaptığınızda, istenen örneğin boyutunu (satır sayısı) ve örnekleme yöntemini (ilk kayıtlar, son kayıtlar veya rastgele bir küme) belirtmek için seçenekler içeren bir açılır pencere başlatılır.
Özet istatistikleri görüntüleme
Data Wrangler yüklendiğinde, Özet panelinde seçilen DataFrame'e açıklayıcı bir genel bakış görüntüler. Bu genel bakış DataFrame'in boyutları, eksik değerler ve daha fazlası hakkında bilgi içerir. Data Wrangler kılavuzunda herhangi bir sütunun seçilmesi, Özet panelinden bu sütunla ilgili açıklayıcı istatistikleri güncelleştirmesini ve görüntülemesini ister. Her sütunla ilgili hızlı içgörüler, üst bilgisinde de kullanılabilir.
İpucu
Sütuna özgü istatistikler ve görseller (hem Özet panelinde hem de sütun üst bilgilerinde) sütun veri türüne bağlıdır. Örneğin, bir sayısal sütunun binned histogramı, yalnızca sütun bir sayısal tür olarak yayınlanmışsa sütun üst bilgisinde görünür. En doğru ekran için sütun türlerini yeniden kaydetmek için İşlemler panelini kullanın.
Veri temizleme işlemlerine göz atma
Veri temizleme adımlarının aranabilir bir listesi İşlemler panelinde bulunabilir. (Her sütun üst bilgisinin menüsünde aynı işlemlerin daha küçük bir seçimi kullanılabilir.) İşlemler panelinden bir veri temizleme adımı seçildiğinde, adımı tamamlamak için gerekli parametrelerle birlikte bir hedef sütun veya sütun sağlamanız istenir. Örneğin, bir sütunu sayısal olarak ölçeklendirme istemi için yeni bir değer aralığı gerekir.
İşlemleri önizleme ve uygulama
Seçili işlemin sonuçları Veri Wrangler görüntüleme kılavuzunda otomatik olarak önizlemeye eklenir ve ilgili kod kılavuzun altındaki panelde otomatik olarak görünür. Önizlenen kodu işlemek için her iki yerde de "Uygula"yı seçin. Önizlenen koddan kurtulmak ve yeni bir işlem denemek için "At"ı seçin.
Bir işlem uygulandıktan sonra, Data Wrangler görüntüleme kılavuzu ve özet istatistikleri sonuçları yansıtacak şekilde güncelleştirilir. Kod, Temizleme adımları panelinde bulunan çalışan işlenen işlemler listesinde görünür.
İpucu
En son uygulanan adımı, yanındaki çöp kutusu simgesiyle istediğiniz zaman geri alabilirsiniz. Bu simge, imlecinizi Temizleme adımları panelinde bu adımın üzerine getirdiğinizde görünür.
Aşağıdaki tabloda, Data Wrangler'ın şu anda desteklediği işlemler özetlemektedir:
İşlem | Açıklama |
---|---|
Sırala | Sütunu artan veya azalan düzende sıralama |
Filtre | Satırları bir veya daha fazla koşula göre filtreleme |
Tek erişimli kodlama | Var olan bir sütundaki her benzersiz değer için, satır başına bu değerlerin varlığını veya yokluğunu gösteren yeni sütunlar oluşturun |
Sınırlayıcı ile tek etkin kodlama | Sınırlayıcı kullanarak kategorik verileri bölme ve tek erişimli kodlama |
Sütun türünü değiştirme | Sütunun veri türünü değiştirme |
Sütunu bırak | Bir veya daha fazla sütunu silme |
Sütun seç | Tutulacak bir veya daha fazla sütun seçin ve kalan sütunları silin |
Sütunu yeniden adlandır | Sütunu yeniden adlandırma |
Eksik değerleri bırakma | Eksik değerleri olan satırları kaldırma |
Yinelenen satırları bırakma | Yinelenen değerler içeren tüm satırları bir veya daha fazla sütuna bırakın |
Eksik değerleri doldurma | Hücreleri eksik değerlerle yeni bir değerle değiştirme |
Bulma ve değiştirme | Hücreleri tam olarak eşleşen bir desenle değiştirme |
Sütuna ve toplamaya göre gruplandırma | Sütun değerlerine göre gruplandırma ve sonuçları toplama |
Beyaz alanı şeritle | Metnin başından ve sonundan boşluk kaldırma |
Metni bölme | Bir sütunu kullanıcı tanımlı sınırlayıcıya göre birkaç sütuna bölme |
Metni küçük harfe dönüştürme | Metni küçük harfe dönüştürme |
Metni büyük harfe dönüştürme | Metni BÜYÜK HARFe dönüştürme |
En düşük/en yüksek değerleri ölçeklendirme | Sayısal sütunu en küçük ve en büyük değer arasında ölçeklendirme |
Hızlı Doldurma | Mevcut bir sütundan türetilen örnekleri temel alarak otomatik olarak yeni bir sütun oluşturma |
Kodu kaydetme ve dışarı aktarma
Data Wrangler görüntü kılavuzunun üzerindeki araç çubuğu, oluşturulan kodu kaydetmek için seçenekler sağlar. Kodu panoya kopyalayabilir veya işlev olarak not defterine aktarabilirsiniz. Kodu dışarı aktarmak Data Wrangler'ı kapatır ve yeni işlevi not defterindeki bir kod hücresine ekler. Temizlenen DataFrame'i csv dosyası olarak da indirebilirsiniz.
İpucu
Data Wrangler tarafından oluşturulan kod, yeni hücreyi el ile çalıştırana kadar uygulanmaz ve özgün DataFrame'inizin üzerine yazılmaz.
İlgili içerik
- Spark DataFrame'lerde Data Wrangler'ı denemek için bu yardımcı makaleye bakın.
- VS Code'da Veri Wrangler'ı denemek için bkz . VS Code'da Veri Wrangler.
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin