Göreli ifade kullanarak veri kümesini bölme
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning'e taşıma hakkındaki bilgilere bakın.
- Azure Machine Learning hakkında daha fazla bilgi edinin.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
Bu makalede Machine Learning Studio'nun Verileri Bölme modülünde (klasik) Göreli İfade Bölme seçeneğinin nasıl kullanılacağı açıklanmaktadır. Bu seçenek, bir veri kümesini sayısal bir ifade kullanarak eğitim ve test veri kümelerine bölmeniz gerektiğinde yararlıdır. Örnek:
- Yaş 40 ile 40 yaş veya daha küçük
- Test puanı 60 veya daha yüksek ve 60'tan küçük
- 1 ile diğer tüm değerlerin derece değeri karşılaştırması
Not
Şunlar için geçerlidir: Yalnızca Machine Learning Studio (klasik)
Benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısında da kullanılabilir.
Verilerinizi bölmek için, verilerinizde tek bir sayısal sütun seçer ve her satırı değerlendirirken kullanılacak bir ifade tanımlarsınız. Göreli ifade sütun adını, değeri ve büyüktür ve küçüktür, eşittir ve eşit değil gibi bir işleci içermelidir.
Bu seçenek veri kümesini iki gruba ayırır.
Makine öğrenmesi denemeleri için veri bölümleme hakkında genel bilgi için bkz. Verileri Bölme ve Bölümleme ve Bölme.
İlişkili görevler
Verileri Bölme modülündeki diğer seçenekler:
Normal ifadeleri kullanarak verileri bölme: Tek bir metin sütununa normal ifade uygulama ve veri kümesini sonuçlara göre bölme
Önerilen veri kümelerini bölme: Öneri modellerinde kullanılan veri kümelerini bölün. Veri kümesinin üç sütunu olmalıdır: öğeler, kullanıcılar ve derecelendirmeler
Veri kümesini bölmek için göreli ifade kullanma
Verileri Bölme modülünü Stuio'daki denemenize ekleyin ve bölmek istediğiniz veri kümesine giriş olarak bağlayın.
Bölme modu için göreli ifade bölme'yi seçin.
İlişkisel ifade metin kutusuna, tek bir sütuna sayısal karşılaştırma işlemi gerçekleştiren bir ifade yazın:
Sütun, tarih/saat veri türleri de dahil olmak üzere herhangi bir sayısal veri türünün sayılarını içerir.
İfade en fazla bir sütun adına başvurabilir.
AND işlemi için ve karakterini (&) ve OR işlemi için kanal karakterini (|) kullanın.
Aşağıdaki işleçler desteklenir:
<
,>
,<=
,>=
,==
,!=
ve
)
kullanarak(
işlemleri gruplandıramazsınız.
Fikirler için Örnekler bölümüne bakın.
Denemeyi çalıştırın veya modüle sağ tıklayıp Seçili çalıştır'ı seçin.
İfade, veri kümesini iki satır kümesine böler: koşulu karşılayan değerlere sahip satırlar ve kalan tüm satırlar.
Ek bölme işlemleri gerçekleştirmeniz gerekiyorsa, *Verileri Bölme'nin ikinci bir örneğini ekleyebilir veya SQL Dönüşümü Uygulama modülünü kullanarak bir CASE deyimi tanımlayabilirsiniz.
Relatve ifade örnekleri
Aşağıdaki örneklerde, Verileri Bölme modülündeki Göreli İfade seçeneğini kullanarak bir veri kümesinin nasıl bölündüğü gösterilmektedir:
Takvim yıllarını kullanma
Yaygın bir senaryo, bir veri kümesini yıllara bölmektir. Aşağıdaki ifade, sütundaki Year
değerlerin değerinden 2010
büyük olduğu tüm satırları seçer.
\"Year" > 2010
Tarih ifadesi, veri sütununa dahil edilen tüm tarih bölümlerini hesaba almalıdır ve veri sütunundaki tarihlerin biçimi tutarlı olmalıdır.
Örneğin, biçimini mmddyyyy
kullanan bir tarih sütununda ifade aşağıdakine benzer olmalıdır:
\"Date" > 1/1/2010
Sütun dizinlerini kullanma
Aşağıdaki ifade, veri kümesinin ilk sütunundaki 30'a eşit veya 30'a eşit olmayan ancak 20'ye eşit olmayan tüm satırları seçmek için sütun dizinini nasıl kullanabileceğinizi gösterir.
(\0)<=30 & !=20
Birden çok bölme kullanan zaman değerleri üzerinde bileşik işlem
Çok uzun süre çalışan sorguları gruplandırmak için günlük verileri tablosunu bölmek istediğinizi varsayalım. 1 dakikadan fazla çalıştırdığınız sorguları almak için sütununda Elapsed
aşağıdaki göreli ifadeyi kullanabilirsiniz.
\"Elapsed" >00:01:00
Yanıt süreleri bir dakikadan fazla ama 30 saniyeden uzun olan sorguları almak için sağ taraftaki çıkışa başka bir Veri Bölme örneği ekleyin ve aşağıdaki gibi bir ifade kullanın:
\"Elapsed" <:00:01:00 & >00:00:30
Veri kümesini tarih değerlerinde bölme
Aşağıdaki göreli ifade, sütunundaki dt1
tarih değerlerini kullanarak veri kümesini böler.
\"dt1" > 10-08-2015
Tarihi 10-08-2015'ten büyük olan satırlar ilk (sol) çıkış veri kümesine eklenir.
10-08-2015 veya önceki bir tarihe sahip satırlar ikinci (sağ) çıkış veri kümesine eklenir.
Teknik notlar
Bu bölüm uygulama ayrıntılarını, ipuçlarını ve sık sorulan soruların yanıtlarını içerir.
Kısıtlamalar
Bir veri kümesindeki göreli ifadeler için aşağıdaki kısıtlamalar geçerlidir:
- Göreli ifadeler yalnızca sayısal veri türlerine ve tarih/saat veri türlerine uygulanabilir.
- Göreli ifadeler en fazla bir sütun adına başvurabilir.
- AND işlemi için ve karakterini (&) ve OR işlemi için kanal karakterini (|) kullanın.
- Göreli ifadeler için aşağıdaki işleçlere izin verilir:
<
,>
,<=
,>=
, ,==
,!=
- Parantezlerle gruplandırma işlemleri desteklenmez.