Aracılığıyla paylaş


Verileri birleştirme

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

İki veri kümesine katılır

Kategori: Veri Dönüştürme / Düzenleme

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Modüle genel bakış

Bu makalede, veritabanı stili birleştirme işlemi kullanarak iki veri kümesi birleştirmek için Machine Learning Studio'da (klasik) Veri Birleştirme modülünün nasıl kullanımı açıklanmıştır.

İki veri kümesi üzerinde birleştirme gerçekleştirmek için bunların tek bir anahtar sütunuyla ilişkili olması gerekir. Bileşik anahtarlar desteklenmiyor.

Birleştirme Verilerini yapılandırma

  1. Machine Learning Studio'da (klasik) birleştirmek istediğiniz veri kümelerini ekleyin ve Verileri Birleştir modülünü denemenize sürükleyin.

    Modülü Veri Dönüştürme kategorisindeki İşleme altında bulabilirsiniz.

  2. Bağlan birleştirme modülüne veri kümelerini kullanın.

    Verileri Birleştirme modülü sağ dış birleştirmeyi desteklemez, bu nedenle belirli bir veri kümesinden satırların çıkışa dahil olduğundan emin olmak için bu veri kümesi sol girişte olmalıdır.

  3. Sol girişte veri kümesi için tek bir anahtar sütunu seçmek için Sütun seçiciyi başlat'a tıklayın.

  4. Doğru girişte veri kümesi için tek bir anahtar sütunu seçmek için Sütun seçiciyi başlat'a tıklayın.

  5. Bir metin sütununa katılıyorsanız ve birleştirmenin büyük/küçük harf duyarlılığını korumasını sağlamak için Büyük/küçük harf eşleşmesi seçeneğini belirleyin.

    Örneğin, bu seçeneği tercih ettiyseniz değerinden A1000 farklı bir anahtar değeri olarak kabul edilir a1000.

    Bu seçeneğin seçimini kaldırsanız, büyük/ küçük harf duyarlılığı uygulanmaz ve A1000 ile aynı kabul edilir a1000.

  6. Veri kümelerini birleştirmeyi belirtmek için Birleştirme türü açılan listesini kullanın. Tür:

    • İç Birleşim: İç birleşim , tipik birleştirme işlemidir. Yalnızca anahtar sütunlarının değerleri eşleştirken birleştirilmiş satırları döndürür.

    • Sol Dış Birleştirme: Sol dış birleşim, sol tablodaki tüm satırlar için bir araya gelen satırları döndürür. Sol tablodaki bir satırda sağ tabloda eşleşen satır yoksa, eksik değerler için bir değiştirme değeri belirtmedikçe döndürülen satırda sağ tablodan gelen tüm sütunlar için eksik değerler bulunur.

    • Tam Dış Birleştirme: Tam dış birleşim, sol tablodaki (tablo1) ve sağ tablodaki (tablo2) tüm satırları döndürür.

      Sol tablodaki sağ tabloda eşleşen satırlar yer alan satırların her biri için birleştirme sonuçları, sağ tablodan eksik değerleri içeren bir satır içerir.

      Sol tabloda eşleşen satırlar yer alan sağ tablodaki satırların her biri için birleştirme sonuçları, sol tablodaki tüm sütunlar için eksik değerleri içeren bir satır içerir.

    • Sol Yarı Birleştirme: Sol yarı birleşim, anahtar sütunlarının değerleri eşleyene kadar yalnızca sol tablodaki değerleri döndürür.

  7. seçeneği için, bir araya katılmış tabloda sağ anahtar sütunlarını tut:

    • Sonuçlarda tek bir anahtar sütunu alma seçeneğinin seçimini kaldırın.
    • Her iki giriş tablodaki anahtarları görüntülemek için seçeneğini seçili bırakın.
  8. Denemeyi çalıştırın veya Birleştirme işlemini gerçekleştirmek için Verileri Birleştirme modülünü ve Seçileni Çalıştır'ı seçin.

  9. Sonuçları görüntülemek için Verileri Birleştirme modülüne sağ tıklayın, Sonuçlar veri kümesi'ne tıklayın ve Görselleştir'e tıklayın.

Örnekler

Bu modülün nasıl kullanıldıklarının örneklerini aşağıdaki Azure Yapay Zeka Galerisi:

Teknik notlar

Bu bölümde, uygulama ayrıntıları ve sık sorulan bazı soruların yanıtları açıktır.

Kısıtlamalar

  • Birleştirilmiş veri kümesi aynı adla iki sütuna sahip olamaz. Sol ve sağ veri kümelerinin yinelenen sütun adları varsa, bunları benzersiz hale eklemek için sağ veri kümesi sütun adlarına sayısal bir sonek eklenir.

    Örneğin, her iki veri kümesinde de Month adlı bir sütun varsa, sol veri kümesinden sütun olduğu gibi kalır ve sağ veri kümesinden sütunun adı Month (1) olur.

  • Anahtar değerlerinin karşılaştırılması için kullanılan algoritma karma zorlamalı algoritmadır.

  • Bir araya gelen veri kümesine karşılık gelen sütun kategorikse, bir araya gelen veri kümesine ilişkin her sütun kategorik türü korur.

  • Sol dış birleşimlerde eksik değerler varsa sol veri kümesinde eksik değerler için kategorik bir düzey oluşturulur. Bir araya (sağ) veri kümesinde eksik değer yoksa bile bu durum doğrudur.

Bir tabloyu bileşik anahtar üzerinde nasıl bir birleşime katabilirsiniz?

Bileşik anahtarlar kullanan bir tabloyu birleştirmeniz gerekirse (yani birincil anahtar iki bağımsız sütunu kullanır), iki anahtar sütunlarının içeriğini birleştirmek için aşağıdaki gibi bir modül kullanın:

  • R Betiği yürütme

    Örneğin, giriş veri çerçevesinin ilk ve ikinci sütunlarını ayırıcı olarak kısa çizgi kullanarak biriktirme için R betiği içinde aşağıdaki gibi bir kod kullanın. paste(inputdf$Col1,inputdf$Col2,sep="-")

  • SQL Dönüşümü Uygulama

    SQLite'daki concatenation işleci olur ||.

Anahtarı olan tabloları nasıl birleştirmem gerekir?

Veri kümenizin anahtar sütunu yoksa, anahtar oluşturarak veya Sütun Ekle modülünü kullanarak veri kümenizi başka bir veri kümesiyle birleştirmeye devam edersiniz.

Sütun Ekle modülü R gibi davranır ve veri kümelerinin aynı sayıda satıra sahip olması halinde iki veri kümelerini satır bazında birleştirebilirsiniz. Veri kümeleri farklı boyutta olursa bir hata ortaya çıkar.

Beklenen girişler

Ad Tür Description
Veri kümesi1 Veri Tablosu Katılmak için ilk veri kümesi
Veri kümesi2 Veri Tablosu Katılmak için ikinci veri kümesi

Modül parametreleri

Name Aralık Tür Varsayılan Description
L için anahtar sütunlarını birleştirme Herhangi biri ColumnSelection İlk veri kümesi için birleştirme anahtarı sütunlarını seçin.
R için anahtar sütunlarını birleştirme Herhangi biri ColumnSelection İkinci veri kümesi için birleştirme anahtarı sütunlarını seçin.
Eşleşme durumu Herhangi biri Boole Doğru Anahtar sütunlarında büyük/küçük harfe duyarlı karşılaştırmaya izin verili olup olmadığını gösterir.
Katılım türü Liste Tür İç birleştirme Bir JOIN türü seçin.
Birleşik tabloda sağ anahtar sütunları tut Herhangi biri Boole Doğru Birleşik veri kümesindeki ikinci veri kümesinden anahtar sütunlarının tutulup tutulmayacağını belirtin.

Çıktı

Ad Tür Description
Sonuç veri kümesi Veri tablosu JOIN işleminin sonucu

Özel durumlar

Özel durum Description
Hata 0001 Veri kümesinin bir veya daha fazla belirtilen sütunu bulunamıyorsa bir özel durum oluşur.
Hata 0003 Bir veya daha fazla giriş null veya boşsa bir özel durum oluşur.
Hata 0006 Parametre belirtilen değerden büyük veya bu değere eşitse bir özel durum oluşur.
Hata 0016 Modüle geçirilen giriş veri kümelerinin uyumlu sütun türleri olması gerekiyorsa, ancak bu durum oluşur.
Hata 0017 Belirtilen bir veya daha fazla sütunda geçerli modül tarafından desteklenmeyen türler varsa bir özel durum oluşur.
Hata 0020 Modüle geçirilen bazı veri kümelerinde sütun sayısı çok küçük olduğunda bir özel durum oluşur.
Hata 0028 Sütun kümesi yinelenen sütun adları içerdiğinde bir özel durum oluşur ve buna izin verilmez.
Hata 0011 Geçirilen sütun kümesi için bağımsız değişken herhangi bir veri kümesi sütunu için uygulanamayan bir özel durum oluşur.
Hata 0027 İki nesnenin aynı boyutta olması gerektiğinde bir özel durum oluşur, ancak bunlar değildir.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning hata kodları.

apı özel durumlarının listesi için bkz. Machine Learning REST API hata kodları.

Ayrıca bkz.

İşleme
Veri dönüştürme
A-Z modül listesi