Aracılığıyla paylaş


Verileri İçeri Aktar bileşeni

Bu makalede Azure Machine Learning tasarımcısındaki bir bileşen açıklanmaktadır.

Mevcut bulut veri hizmetlerinden bir makine öğrenmesi işlem hattına veri yüklemek için bu bileşeni kullanın.

Not

Bu bileşen tarafından sağlanan tüm işlevler, çalışma alanı giriş sayfasındaki veri deposu ve veri kümeleri tarafından gerçekleştirilebilir. Veri izleme gibi ek özellikler içeren veri depolarını ve veri kümesini kullanmanızı öneririz. Daha fazla bilgi edinmek için Verilere Erişme ve Veri Kümelerini Kaydetme makalesine bakın. Bir veri kümesini kaydettikten sonra tasarımcı arabirimindeki Veri Kümelerim ->Veri Kümelerim kategorisinde bulabilirsiniz. Bu bileşen, tanıdık bir deneyim için Studio(klasik) kullanıcılarına ayrılmıştır.

Verileri İçeri Aktar bileşeni aşağıdaki kaynaklardan okuma verilerini destekler:

  • HTTP üzerinden URL
  • Veri depoları aracılığıyla Azure bulut depolamaları)
    • Azure Blob Kapsayıcısı
    • Azure Dosya Paylaşımı
    • Azure Data Lake
    • Azure Data Lake 2. Nesil
    • Azure SQL Veritabanı
    • Azure PostgreSQL

Bulut depolamayı kullanmadan önce Azure Machine Learning çalışma alanınıza bir veri deposu kaydetmeniz gerekir. Daha fazla bilgi için bkz . Verilere Erişme.

İstediğiniz verileri tanımladıktan ve kaynağa bağlandıktan sonra Verileri İçeri Aktar, içerdiği değerlere göre her sütunun veri türünü çıkarsar ve verileri tasarımcı işlem hattınıza yükler. Verileri İçeri Aktar'ın çıkışı, herhangi bir tasarımcı işlem hattıyla kullanılabilen bir veri kümesidir.

Kaynak verileriniz değişirse Verileri İçeri Aktar'ı yeniden çalıştırarak veri kümesini yenileyebilir ve yeni veriler ekleyebilirsiniz.

Uyarı

Çalışma alanınız bir sanal ağdaysa, veri depolarınızı tasarımcının veri görselleştirme özelliklerini kullanacak şekilde yapılandırmanız gerekir. Sanal ağda veri depolarını ve veri kümelerini kullanma hakkında daha fazla bilgi için bkz. Azure sanal ağında Azure Machine Learning stüdyosu kullanma.

Verileri İçeri Aktar'ı yapılandırma

  1. verileri içeri aktar bileşenini işlem hattınıza ekleyin. Bu bileşeni tasarımcıdaki Veri Girişi ve Çıktı kategorisinde bulabilirsiniz.

  2. Sağ bölmeyi açmak için bileşeni seçin.

  3. Veri kaynağı'nı seçin ve veri kaynağı türünü seçin. HTTP veya veri deposu olabilir.

    Veri depolarını seçerseniz, Azure Machine Learning çalışma alanınıza zaten kayıtlı olan mevcut veri depolarını seçebilir veya yeni bir veri deposu oluşturabilirsiniz. Ardından veri deposunda içeri aktaracak verilerin yolunu tanımlayın. Yola Gözat'ı seçerek yola kolayca göz atabilirsiniz.

    Yol seçimi iletişim kutusunu açan Yola gözat bağlantısını gösteren ekran görüntüsü.

    Not

    Veri İçeri Aktarma bileşeni yalnızca Tablo verileri içindir. Birden çok tablosal veri dosyasını bir kez içeri aktarmak istiyorsanız, bunun için aşağıdaki koşullar gerekir; aksi takdirde hatalar oluşur:

    1. Klasöre tüm veri dosyalarını eklemek için Yol girişini folder_name/** yapmanız gerekir.
    2. Tüm veri dosyaları unicode-8 ile kodlanmalıdır.
    3. Tüm veri dosyaları aynı sütun numaralarına ve sütun adlarına sahip olmalıdır.
    4. Birden çok veri dosyasını içeri aktarmanın sonucu, birden çok dosyadaki tüm satırları sırayla birleştirmektir.
  4. Eklemek istediğiniz sütunları filtrelemek için önizleme şemasını seçin. Ayrıştırma seçeneklerinde Sınırlayıcı gibi gelişmiş ayarlar da tanımlayabilirsiniz.

    Sütun 3, 4, 5 ve 6'nın seçili olduğu şema önizlemesinin ekran görüntüsü.

  5. Çıkışı yeniden oluştur onay kutusu , çalışma zamanında çıkışı yeniden oluşturmak için bileşenin yürütülip yürütülmeyeceğine karar verir.

    Varsayılan olarak seçili değil, yani bileşen daha önce aynı parametrelerle yürütüldüyse, sistem çalışma süresini kısaltmak için son çalıştırmanın çıkışını yeniden kullanır.

    Seçilirse sistem, çıkışı yeniden oluşturmak için bileşeni yeniden yürütür. Bu nedenle, depolamadaki temel alınan veriler güncelleştirildiğinde bu seçeneği belirleyin; en son verileri almanıza yardımcı olabilir.

  6. İşlem hattını gönderin.

    Verileri İçeri Aktar, verileri tasarımcıya yüklediğinde, içerdiği değerlere (sayısal veya kategorik) göre her sütunun veri türünü çıkarsar.

    Üst bilgi varsa, çıktı veri kümesinin sütunlarını adlandırmak için üst bilgi kullanılır.

    Verilerde sütun üst bilgisi yoksa, sütun1, sütun2 biçimi kullanılarak yeni sütun adları oluşturulur,... Coln*.

Sonuçlar

İçeri aktarma tamamlandığında, çıktı veri kümesine sağ tıklayın ve verilerin başarıyla içeri aktarılıp aktarılamadığını görmek için Görselleştir'i seçin.

İşlem hattı her çalıştırıldığında yeni bir veri kümesini içeri aktarmak yerine verileri yeniden kullanmak üzere kaydetmek istiyorsanız, bileşenin sağ panelindeki Çıkışlar+günlükler sekmesinin altındaki Veri kümesini kaydet simgesini seçin. Veri kümesi için bir ad seçin. Kaydedilen veri kümesi, kaydetme sırasında verileri korur. İşlem hattındaki veri kümesi değişse bile işlem hattı yeniden çalıştırıldığında veri kümesi güncelleştirilmez. Bu, verilerin anlık görüntülerini almak için yararlı olabilir.

Verileri içeri aktardıktan sonra modelleme ve analiz için bazı ek hazırlıklar gerekebilir:

Sınırlamalar

Veri deposu erişim sınırlaması nedeniyle çıkarım işlem hattınız Verileri İçeri Aktar bileşenini içeriyorsa, gerçek zamanlı uç noktaya dağıtıldığında otomatik olarak kaldırılır.

Sonraki adımlar

Bkz. Azure Machine Learning için kullanılabilen bileşenler kümesi.