Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- Makine öğrenmesi projelerini ML Studio'dan (klasik) Azure Machine Learning.
- Daha fazla bilgi Azure Machine Learning.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
İki veri kümesine katılır
Kategori: Veri Dönüştürme / Düzenleme
Not
Uygulama: Machine Learning Studio (yalnızca klasik)
Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.
Modüle genel bakış
Bu makalede, veritabanı stili birleştirme işlemi kullanarak iki veri kümesi birleştirmek için Machine Learning Studio'da (klasik) Veri Birleştirme modülünün nasıl kullanımı açıklanmıştır.
İki veri kümesi üzerinde birleştirme gerçekleştirmek için bunların tek bir anahtar sütunuyla ilişkili olması gerekir. Bileşik anahtarlar desteklenmiyor.
Birleştirme Verilerini yapılandırma
Machine Learning Studio'da (klasik) birleştirmek istediğiniz veri kümelerini ekleyin ve Verileri Birleştir modülünü denemenize sürükleyin.
Modülü Veri Dönüştürme kategorisindeki İşleme altında bulabilirsiniz.
Bağlan birleştirme modülüne veri kümelerini kullanın.
Verileri Birleştirme modülü sağ dış birleştirmeyi desteklemez, bu nedenle belirli bir veri kümesinden satırların çıkışa dahil olduğundan emin olmak için bu veri kümesi sol girişte olmalıdır.
Sol girişte veri kümesi için tek bir anahtar sütunu seçmek için Sütun seçiciyi başlat'a tıklayın.
Doğru girişte veri kümesi için tek bir anahtar sütunu seçmek için Sütun seçiciyi başlat'a tıklayın.
Bir metin sütununa katılıyorsanız ve birleştirmenin büyük/küçük harf duyarlılığını korumasını sağlamak için Büyük/küçük harf eşleşmesi seçeneğini belirleyin.
Örneğin, bu seçeneği tercih ettiyseniz değerinden
A1000farklı bir anahtar değeri olarak kabul edilira1000.Bu seçeneğin seçimini kaldırsanız, büyük/ küçük harf duyarlılığı uygulanmaz ve
A1000ile aynı kabul edilira1000.Veri kümelerini birleştirmeyi belirtmek için Birleştirme türü açılan listesini kullanın. Tür:
İç Birleşim: İç birleşim , tipik birleştirme işlemidir. Yalnızca anahtar sütunlarının değerleri eşleştirken birleştirilmiş satırları döndürür.
Sol Dış Birleştirme: Sol dış birleşim, sol tablodaki tüm satırlar için bir araya gelen satırları döndürür. Sol tablodaki bir satırda sağ tabloda eşleşen satır yoksa, eksik değerler için bir değiştirme değeri belirtmedikçe döndürülen satırda sağ tablodan gelen tüm sütunlar için eksik değerler bulunur.
Tam Dış Birleştirme: Tam dış birleşim, sol tablodaki (tablo1) ve sağ tablodaki (tablo2) tüm satırları döndürür.
Sol tablodaki sağ tabloda eşleşen satırlar yer alan satırların her biri için birleştirme sonuçları, sağ tablodan eksik değerleri içeren bir satır içerir.
Sol tabloda eşleşen satırlar yer alan sağ tablodaki satırların her biri için birleştirme sonuçları, sol tablodaki tüm sütunlar için eksik değerleri içeren bir satır içerir.
Sol Yarı Birleştirme: Sol yarı birleşim, anahtar sütunlarının değerleri eşleyene kadar yalnızca sol tablodaki değerleri döndürür.
seçeneği için, bir araya katılmış tabloda sağ anahtar sütunlarını tut:
- Sonuçlarda tek bir anahtar sütunu alma seçeneğinin seçimini kaldırın.
- Her iki giriş tablodaki anahtarları görüntülemek için seçeneğini seçili bırakın.
Denemeyi çalıştırın veya Birleştirme işlemini gerçekleştirmek için Verileri Birleştirme modülünü ve Seçileni Çalıştır'ı seçin.
Sonuçları görüntülemek için Verileri Birleştirme modülüne sağ tıklayın, Sonuçlar veri kümesi'ne tıklayın ve Görselleştir'e tıklayın.
Örnekler
Bu modülün nasıl kullanıldıklarının örneklerini aşağıdaki Azure Yapay Zeka Galerisi:
Akciğer kanseri algılama: Birleştirme Verileri , pozitif eğitim durumlarını, vakaların oranı ayarlandıktan sonra negatif eğitim örnekleriyle birleştirmek için kullanılır.
Uçuş gecikmesi tahmini: Bu örnekte, dış veri kümelerinden yararlı özellikleri bir araya getirmek için Verileri Birleştirme kullanılır.
Film önerisi: Film kimliği yerine önerilen film başlıklarını sunmamız için iki veri kümesi bir araya geldi.
Öğrenci performansı tahmini: Bu örnekte, yeni özellikleri getirmek için Veri Birleştirme kullanılır.
Teknik notlar
Bu bölümde, uygulama ayrıntıları ve sık sorulan bazı soruların yanıtları açıktır.
Kısıtlamalar
Birleştirilmiş veri kümesi aynı adla iki sütuna sahip olamaz. Sol ve sağ veri kümelerinin yinelenen sütun adları varsa, bunları benzersiz hale eklemek için sağ veri kümesi sütun adlarına sayısal bir sonek eklenir.
Örneğin, her iki veri kümesinde de Month adlı bir sütun varsa, sol veri kümesinden sütun olduğu gibi kalır ve sağ veri kümesinden sütunun adı Month (1) olur.
Anahtar değerlerinin karşılaştırılması için kullanılan algoritma karma zorlamalı algoritmadır.
Bir araya gelen veri kümesine karşılık gelen sütun kategorikse, bir araya gelen veri kümesine ilişkin her sütun kategorik türü korur.
Sol dış birleşimlerde eksik değerler varsa sol veri kümesinde eksik değerler için kategorik bir düzey oluşturulur. Bir araya (sağ) veri kümesinde eksik değer yoksa bile bu durum doğrudur.
Bir tabloyu bileşik anahtar üzerinde nasıl bir birleşime katabilirsiniz?
Bileşik anahtarlar kullanan bir tabloyu birleştirmeniz gerekirse (yani birincil anahtar iki bağımsız sütunu kullanır), iki anahtar sütunlarının içeriğini birleştirmek için aşağıdaki gibi bir modül kullanın:
-
Örneğin, giriş veri çerçevesinin ilk ve ikinci sütunlarını ayırıcı olarak kısa çizgi kullanarak biriktirme için R betiği içinde aşağıdaki gibi bir kod kullanın.
paste(inputdf$Col1,inputdf$Col2,sep="-") -
SQLite'daki concatenation işleci olur
||.
Anahtarı olan tabloları nasıl birleştirmem gerekir?
Veri kümenizin anahtar sütunu yoksa, anahtar oluşturarak veya Sütun Ekle modülünü kullanarak veri kümenizi başka bir veri kümesiyle birleştirmeye devam edersiniz.
Sütun Ekle modülü R gibi davranır ve veri kümelerinin aynı sayıda satıra sahip olması halinde iki veri kümelerini satır bazında birleştirebilirsiniz. Veri kümeleri farklı boyutta olursa bir hata ortaya çıkar.
Beklenen girişler
| Ad | Tür | Description |
|---|---|---|
| Veri kümesi1 | Veri Tablosu | Katılmak için ilk veri kümesi |
| Veri kümesi2 | Veri Tablosu | Katılmak için ikinci veri kümesi |
Modül parametreleri
| Name | Aralık | Tür | Varsayılan | Description |
|---|---|---|---|---|
| L için anahtar sütunlarını birleştirme | Herhangi biri | ColumnSelection | İlk veri kümesi için birleştirme anahtarı sütunlarını seçin. | |
| R için anahtar sütunlarını birleştirme | Herhangi biri | ColumnSelection | İkinci veri kümesi için birleştirme anahtarı sütunlarını seçin. | |
| Eşleşme durumu | Herhangi biri | Boole | Doğru | Anahtar sütunlarında büyük/küçük harfe duyarlı karşılaştırmaya izin verili olup olmadığını gösterir. |
| Katılım türü | Liste | Tür | İç birleştirme | Bir JOIN türü seçin. |
| Birleşik tabloda sağ anahtar sütunları tut | Herhangi biri | Boole | Doğru | Birleşik veri kümesindeki ikinci veri kümesinden anahtar sütunlarının tutulup tutulmayacağını belirtin. |
Çıktı
| Ad | Tür | Description |
|---|---|---|
| Sonuç veri kümesi | Veri tablosu | JOIN işleminin sonucu |
Özel durumlar
| Özel durum | Description |
|---|---|
| Hata 0001 | Veri kümesinin bir veya daha fazla belirtilen sütunu bulunamıyorsa bir özel durum oluşur. |
| Hata 0003 | Bir veya daha fazla giriş null veya boşsa bir özel durum oluşur. |
| Hata 0006 | Parametre belirtilen değerden büyük veya bu değere eşitse bir özel durum oluşur. |
| Hata 0016 | Modüle geçirilen giriş veri kümelerinin uyumlu sütun türleri olması gerekiyorsa, ancak bu durum oluşur. |
| Hata 0017 | Belirtilen bir veya daha fazla sütunda geçerli modül tarafından desteklenmeyen türler varsa bir özel durum oluşur. |
| Hata 0020 | Modüle geçirilen bazı veri kümelerinde sütun sayısı çok küçük olduğunda bir özel durum oluşur. |
| Hata 0028 | Sütun kümesi yinelenen sütun adları içerdiğinde bir özel durum oluşur ve buna izin verilmez. |
| Hata 0011 | Geçirilen sütun kümesi için bağımsız değişken herhangi bir veri kümesi sütunu için uygulanamayan bir özel durum oluşur. |
| Hata 0027 | İki nesnenin aynı boyutta olması gerektiğinde bir özel durum oluşur, ancak bunlar değildir. |
Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.
apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.