Aracılığıyla paylaş


Microsoft Fabric'te Data Wrangler ile veri hazırlığı hızlandırma

Data Wrangler, keşif veri analizi için çevreleyici ve görsel bir arabirim sağlayarak veri hazırlama iş akışınızı hızlandırır. Bu makalede şunları öğreneceksiniz:

  • Fabric defterinizden Veri Wrangler'ı başlatın
  • Etkileşimli görselleştirmeler ve özet istatistiklerle verileri keşfetme
  • Otomatik kod oluşturma ile yaygın veri temizleme işlemlerini uygulama
  • Yeniden kullanılabilir pandas veya PySpark işlevlerini not defterinize geri aktarın

Bu makale pandas DataFrames'e odaklanır. Spark DataFrames için bu kaynağa bakın.

Önkoşullar

Sınırlamalar

  • Özel kod işlemleri şu anda yalnızca pandas DataFrames'i desteklemektedir.
  • Data Wrangler ekranı büyük monitörlerde en iyi şekilde çalışır. Ancak, daha küçük ekranları barındırmak için arabirimin farklı bölümlerini simge durumuna küçültebilir veya gizleyebilirsiniz.

Veri Wrangler'ı başlatma

Tüm pandaları veya Spark DataFrame'i keşfetmek ve dönüştürmek için Data Wrangler'ı doğrudan bir Microsoft Fabric not defterinden başlatabilirsiniz.

Örnek verileri kullanmaya başlamak için:

Bu kod parçacığı, pandas DataFrame'de örnek verilerin nasıl okunduğu gösterilir:

import pandas as pd

# Read a CSV into a Pandas DataFrame
df = pd.read_csv("https://raw.githubusercontent.com/plotly/datasets/master/titanic.csv")
display(df)

Not defteri şeridindeki "Giriş" sekmesinde Veri Wrangler açılan listesini kullanarak düzenleme için kullanılabilen etkin DataFrame'lere göz atın. Data Wrangler'da açmak istediğiniz öğeyi seçin.

Tavsiye

Not defteri çekirdek meşgulken Data Wrangler'i açamazsınız. Bu ekran görüntüsünde gösterildiği gibi, Veri Wrangler'ın başlatılabilmesi için bir yürütme hücresinin bitması gerekir:

Data Wrangler açılır istemi ile bir Fabric not defterini gösteren ekran görüntüsü.

Özel örnekler seçme

Data Wrangler ile herhangi bir etkin DataFrame'in özel örneğini açmak için, bu ekran görüntüsünde gösterildiği gibi açılan listeden Özel örnek seç'i seçin:

Örnek seçeneğinin ana hatlarıyla gösterildiği Data Wrangler açılan istemini gösteren ekran görüntüsü.

Bu eylem, istenen örneğin boyutunu (satır sayısı) ve örnekleme yöntemini (ilk kayıtlar, son kayıtlar veya rastgele bir küme) belirtme seçeneklerini içeren bir iletişim kutusu açar. DataFrame'in ilk 5.000 satırı, bu ekran görüntüsünde gösterildiği gibi varsayılan örnek boyutu görevi görür:

Data Wrangler özel örnek istemini gösteren ekran görüntüsü.

Özet istatistikleri görüntüleme

Data Wrangler yüklendiğinde, Özet panelinde seçilen DataFrame'e açıklayıcı bir genel bakış görüntüler. Bu genel bakış DataFrame boyutları, eksik değerler ve daha fazlası hakkında bilgi içerir. Veri Wrangler kılavuzunda herhangi bir sütunu seçtiğinizde , Özet paneli bu sütunla ilgili açıklayıcı istatistikleri görüntüleyecek şekilde güncelleştirilir. Her sütunla ilgili hızlı içgörüler, başlığında da mevcuttur.

Tavsiye

Sütuna özgü istatistikler ve görseller ( hem Özet panelinde hem de sütun üst bilgilerinde) sütun veri türüne bağlıdır. Örneğin, bu ekran görüntüsünde gösterildiği gibi, sütun başlığında yalnızca sütun sayısal tür olarak yayınlanmışsa sayısal sütunun binned histogramı görüntülenir:

Veri Wrangler görüntüleme kılavuzunu ve Özet panelini gösteren ekran görüntüsü.

Veri temizleme işlemlerine göz atma

İşlemler paneli, veri temizleme işlemlerinin aranabilir bir listesini sağlar. İşlemler panelinden bir veri temizleme işlemi seçtiğinizde, işlemi tamamlamak için gerekli parametrelerle birlikte bir hedef sütun veya sütun sağlamanız gerekir. Örneğin, bir sütunu sayısal olarak ölçeklendirme istemi, bu ekran görüntüsünde gösterildiği gibi yeni bir değer aralığı gerektirir:

Veri Wrangler İşlemleri panelini gösteren ekran görüntüsü.

Tavsiye

Bu ekran görüntüsünde gösterildiği gibi, her sütun üst bilgisinin menüsünden daha küçük bir işlem seçimi uygulayabilirsiniz:

Sütun başlığı menüsünden uygulanabilen bir Veri Wrangler işlemi gösteren ekran görüntüsü.

İşlemleri önizleme ve uygulama

Veri Wrangler görüntüleme ızgarası, seçili işlemin sonuçlarını otomatik olarak önizler ve ilgili kod, ızgaranın altındaki panelde otomatik olarak görünür. Önizlenen kodu işlemek için her iki konumda da uygula'yı seçin. Önizlenen kodu kaldırmak ve yeni bir işlem denemek için bu ekran görüntüsünde gösterildiği gibi At seçin.

Devam eden Veri Wrangler işlemini gösteren ekran görüntüsü.

Bir işlemi uyguladıktan sonra, Veri Wrangler görüntüleme kılavuzu ve özet istatistikleri sonuçları yansıtacak şekilde güncelleştirilir. Kod, bu ekran görüntüsünde gösterildiği gibi Temizleme adımları panelindeki çalışan işlem listesinde görünür:

Uygulanan Veri Wrangler işlemini gösteren ekran görüntüsü.

Tavsiye

En son uygulanan adımı istediğiniz zaman geri alabilirsiniz. Temizleme adımları panelinde, imlecinizi bu ekran görüntüsünde gösterildiği gibi en son uygulanan adımın üzerine getirdiğinizde bir çöp kutusu simgesi görüntülenir:

Geri alınabilen Veri Wrangler işlemini gösteren ekran görüntüsü.

Bu tablo, Data Wrangler'ın şu anda desteklediği işlemleri özetler:

İşlem Açıklama
Sırala Sütunu artan veya azalan düzende sırala
Filtre Satırları bir veya daha fazla koşula göre filtreleme
Tek erişimli kodlama Var olan bir sütundaki her benzersiz değer için, satır başına bu değerlerin varlığını veya yokluğunu gösteren yeni sütunlar oluşturun
Çok etiketli birleştirici Ayırıcı kullanarak verileri bölme ve her kategori için yeni sütunlar oluşturma, bir satırda bu kategori varsa 1, yoksa 0 olarak işaretleme
Sütun türünü değiştirme Sütunun veri türünü değiştirme
Sütunu kaldır Bir veya daha fazla sütunu silme
Sütunu seçin Tutulacak bir veya daha fazla sütun seçin ve kalan sütunları silin
Sütun adını değiştir Sütun ismini değiştirme
Eksik değerleri bırakma Eksik değerleri olan satırları kaldırma
Yinelenen satırları kaldır Yinelenen değerler içeren tüm satırları bir veya daha fazla sütuna bırakın
Eksik değerleri doldurma Eksik değer içeren hücreleri yeni bir değerle değiştir.
Bul ve Değiştir Hücreleri tam olarak eşleşen bir desenle değiştirme
Sütuna göre gruplandır ve birleştir Sütun değerlerine göre gruplandırma ve sonuçları özetleme
Boşlukları temizle Metnin başından ve sonundan boşluk kaldırma
Metni bölme Bir sütunu kullanıcı tanımlı sınırlayıcıya göre birkaç sütuna bölme
Metni küçük harfe dönüştürme Metni küçük harfe dönüştürme
Metni büyük harfe dönüştürme Metni BÜYÜK HARFe dönüştürme
En düşük/en yüksek değerleri ölçeklendirme Sayısal sütunu en küçük ve en büyük değer arasında ölçeklendirme
Hızlı Doldurma Mevcut bir sütundan türetilen örnekleri temel alarak otomatik olarak yeni bir sütun oluşturma

Ekranınızı özelleştirme

İstediğiniz zaman, Veri Wrangler görüntü kılavuzunun üzerindeki araç çubuğundaki "Görünümler" sekmesini kullanarak arabirimi özelleştirebilirsiniz. Bu seçenek, bu ekran görüntüsünde gösterildiği gibi tercihlerinize ve ekran boyutuna göre farklı bölmeleri gizleyebilir veya gösterebilir:

Görüntü görünümünü özelleştirmek için Veri Wrangler menüsünü gösteren ekran görüntüsü.

Kodu kaydetme ve dışarı aktarma

Data Wrangler görüntü kılavuzunun üzerindeki araç çubuğu, oluşturulan kodu kaydetmek için seçenekler sağlar. Kodu panoya kopyalayabilir veya işlev olarak not defterine aktarabilirsiniz. Kodu dışarı aktarmak Data Wrangler'ı kapatır ve yeni işlevi not defterindeki bir kod hücresine ekler. Temizlenen DataFrame'i CSV dosyası olarak da indirebilirsiniz.

Tavsiye

Data Wrangler, yalnızca yeni hücreyi el ile çalıştırdığınızda çalışan bir kod oluşturur ve bu ekran görüntüsünde gösterildiği gibi özgün DataFrame'inizin üzerine yazmaz:

Data Wrangler'da kodu dışarı aktarma seçeneklerini gösteren ekran görüntüsü.

Bu ekran görüntüsünde gösterildiği gibi dışarı aktarılan kodu çalıştırabilirsiniz:

Data Wrangler tarafından oluşturulan kodu not defterine geri gösteren ekran görüntüsü.

Sonraki Adımlar

Data Wrangler'ı pandas DataFrames ile kullanmayı öğrendiğinize göre şu kaynakları keşfedin:

Geri bildirimde bulunmak ister misiniz? Doku Fikirleri forumunda fikirlerinizi paylaşın.