Aracılığıyla paylaş


Azure Blob Depolama dışarı aktar

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

bu makalede, Machine Learning Studio 'daki (klasik) verileri dışarı aktarma modülünde Azure Blob Depolama için dışarı aktar seçeneğinin nasıl kullanılacağı açıklanır.

Not

uygulama hedefi: yalnızca Machine Learning Studio (klasik)

benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.

bu seçenek, Azure Blob Depolama bir machine learning denemesinin verilerini dışarı aktarmak istediğinizde yararlıdır. Örneğin, diğer uygulamalarla makine öğrenimi veri çıkışları paylaşmak veya diğer denemeleri kullanılmak üzere ara verileri veya Temizlenen veri kümelerini depolamak isteyebilirsiniz.

Azure Blob 'larına, HTTP veya HTTPS kullanılarak her yerden erişilebilir. Azure Blob Depolama yapılandırılmamış bir veri deposu olduğundan, verileri çeşitli biçimlerde dışa aktarabilirsiniz. Şu anda, CSV, TSV ve ARFF biçimleri destekleniyor.

verileri Azure blob 'a diğer uygulamalar tarafından kullanılmak üzere dışarı aktarmak için verileri dışarı aktar modülünü Azure Blob Depolama kaydetmek için kullanın. daha sonra, verileri yüklemek ve kullanmak için Azure depolama 'dan (Excel, bulut depolama yardımcı programları veya diğer bulut hizmetleri) veri okuyabilen herhangi bir aracı kullanın.

Not

Verileri Içeri aktarma ve dışarı aktarma modülleri yalnızca klasik dağıtım modeli kullanılarak oluşturulan Azure Storage 'dan verileri okuyabilir ve yazabilir. diğer bir deyişle, sık ve seyrek erişimli depolama erişim katmanları sunan yeni Azure Blob Depolama hesap türü henüz desteklenmiyor.

Genellikle, bu hizmet seçeneği sunulmadan önce oluşturmuş olabileceğiniz tüm Azure depolama hesapları etkilenmemelidir.

ancak, Machine Learning ile kullanmak için yeni bir hesap oluşturmanız gerekiyorsa, dağıtım modeliiçin klasik ' i seçmenizi veya Resource manager ' ı kullanmanızı ve hesap türüiçin, Blob depolamayerine genel amaçlı seçeneğini belirlemeniz önerilir.

Azure Blob Depolama verileri dışarı aktarma

Azure Blob hizmeti, ikili veriler de dahil olmak üzere büyük miktarda veriyi depolamaya yöneliktir. İki tür BLOB depolama alanı vardır: genel blob 'lar ve oturum açma kimlik bilgileri gerektiren Bloblar.

  1. Veri dışa aktarma modülünü denemenize ekleyin. Bu modülü, Studio 'daki veri girişi ve çıkış kategorisinde bulabilirsiniz (klasik).

  2. Bağlan dışarı aktarmak istediğiniz verileri üreten modüle verileri Azure Blob Depolama dışarı aktarın .

  3. Verileri dışarı aktarÖzellikler bölmesini açın. veri hedefi için Azure Blob Depolama' yi seçin.

  4. Bir SAS URL 'SI aracılığıyla depolamanın erişimi desteklediğini biliyorsanız kimlik doğrulama türüiçin ortak (SAS URL) öğesini seçin.

    SAS URL 'SI, Azure Storage yardımcı programı kullanılarak oluşturulabilecek ve yalnızca sınırlı bir süre için kullanılabilen özel bir URL türüdür. Kimlik doğrulaması ve indirme için gereken tüm bilgileri içerir.

    URIiçin, hesabı ve genel blobu TANıMLAYAN tam URI 'yi yazın veya yapıştırın.

  5. Özel hesaplar için Hesap' ı seçin ve hesap adı ve hesap anahtarı ' nı belirtin, böylece deneme depolama hesabına yazabilir.

    • Hesap adı: verileri kaydetmek istediğiniz hesabın adını yazın veya yapıştırın. Örneğin, depolama hesabının tam URL 'SI ise https://myshared.blob.core.windows.net , yazmanız myshared gerekir.

    • Hesap anahtarı: hesapla ilişkili depolama erişim anahtarını yapıştırın.

  6. Kapsayıcı, dizin veya blob yolu: verilecek verilerin depolanacağı Blobun adını yazın. Örneğin, denemenizin sonuçlarını mymldataadlı bir hesaptaki kapsayıcı tahminlerininresults01.csv adlı yeni bir bloba kaydetmek için, Blobun tam URL 'si olur https://mymldata.blob.core.windows.net/predictions/results01.csv .

    Bu nedenle, kapsayıcı, dizin veya Blobun alan yolundakapsayıcı ve BLOB adını aşağıdaki gibi belirtirsiniz: predictions/results01.csv

  7. Zaten mevcut olmayan bir Blobun adını belirtirseniz Azure, blobu sizin için oluşturur.

    mevcut bir bloba yazarken, özelliği ayarlayarak blob 'un geçerli içeriğinin üzerine yazılmasını belirtebilirsiniz Azure Blob Depolama yazma modu. Varsayılan olarak, bu özellik hataolarak ayarlanır, yani aynı ada sahip mevcut bir blob dosyası bulunduğunda hata oluşur.

  8. BLOB dosyası Için dosya biçimiiçin verilerin depolanacağı biçimi seçin.

    • CSV: virgülle ayrılmış değerler (CSV) varsayılan depolama biçimidir. Sütun başlıklarını verilerle birlikte dışarı aktarmak için, BLOB üst bilgisi satırını yazseçeneğini belirleyin. Machine Learning ' de kullanılan virgülle ayrılmış biçim hakkında daha fazla bilgi için bkz. CSV 'ye dönüştürme.

    • TSV: sekmeyle ayrılmış değerler (TSV) biçimi birçok makine öğrenimi araçlarıyla uyumludur. Sütun başlıklarını verilerle birlikte dışarı aktarmak için, BLOB üst bilgisi satırını yazseçeneğini belirleyin. Machine Learning ' de kullanılan sekmeyle ayrılmış biçim hakkında daha fazla bilgi için bkz. TSV 'e dönüştürme.

    • Arff: Bu biçim dosyaları WEKA araç kümesi tarafından kullanılan biçimde kaydetmeyi destekler. Bu biçim bir SAS URL 'sinde depolanan dosyalar için desteklenmez. ARFF biçimi hakkında daha fazla bilgi için bkz. arff 'e dönüştürme.

  9. Önbelleğe alınmış sonuçları kullan: denemeyi her çalıştırışınızda sonuçları blob dosyasına yeniden yazmayı önlemek istiyorsanız bu seçeneği belirleyin. Modül parametrelerinde başka bir değişiklik yoksa, deneme sonuçları yalnızca modülün ilk kez çalıştırıldığı zaman veya verilerde değişiklik olduğunda yazar.

Örnekler

Veri dışa aktarma modülünün nasıl kullanılacağına ilişkin örnekler için Azure yapay zeka Galerisibakın:

  • DataSet 'ı VW biçimine Dönüştür: Bu denemede, Vowpal Wabbit tarafından kullanılabilecek veri oluşturmak Için veri dışa aktarma modülüyle birlikte Python betiği kullanılır.

  • Azure SQL Data Warehouse kullanarak tahmine dayalı analiz işlem hatları ayarlama: bu senaryo, Machine Learning ve SQL Data Warehouse dahil olmak üzere birden çok bileşen arasındaki veri hareketini açıklar.

  • kod yok toplu işlem puanlama: bu öğreticide, denemeleri tarafından kullanılan verilerin içeri aktarılacağını otomatik hale getirmek ve blob depolamaya deneme sonuçları yazmak için Azure Logic Apps nasıl kullanabileceğiniz gösterilmektedir.

  • azure data factory kullanarak azure ML çözümünü şirket içi SQL Server ilehazırlama: bu makalede, bir geçici aşama olarak blob depolamayı kullanarak verileri şirket içi SQL Server veritabanına geri gönderen daha karmaşık bir veri işlem hattı açıklanmaktadır. Şirket içi bir veritabanının kullanılması için bir veri ağ geçidi yapılandırması gerekir, ancak örneğin bu bölümünü atlayabilir ve yalnızca blob depolamayı kullanabilirsiniz.

Teknik notlar

Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.

Sık sorulan sorular

Deneme değiştirilmediyse verilerin yazılmasını nasıl önleyebileceğiniz

Denemenizin sonuçları değiştiğinde, verileri dışarı aktar , her zaman yeni veri kümesini kaydeder. Ancak, çıkış verilerini etkileyen değişiklik yapmadan denemeyi tekrar tekrar çalıştırıyorsanız, önbelleğe alınmış sonuçları kullan seçeneğini belirleyebilirsiniz.

Modül, denemenin daha önce aynı verileri ve aynı seçenekleri kullanarak çalıştırıldığını denetler ve önceki bir çalıştırma bulunursa yazma işlemi yinelenmez.

Verileri farklı bir coğrafi bölgede bir hesaba kaydedebilir miyim

Evet, farklı bölgelerdeki hesaplara veri yazabilirsiniz. Ancak, depolama hesabı makine öğrenimi denemesi için kullanılan işlem düğümünden farklı bir bölgedeyse veri erişimi daha yavaş olabilir. Ayrıca, aboneliğin veri girişi ve çıkışı için ücretlendirilirsiniz.

Modül parametreleri

Genel seçenekler

Name Aralık Tür Varsayılan Description
Veri kaynağı Liste Veri kaynağı veya havuz Azure Blob Depolama hedef, azure BLOB depolama alanında bir dosya, bir azure tablosu, Azure SQL Veritabanı bir tablo veya görünüm ya da bir Hive tablosu olabilir.
Önbelleğe alınmış sonuçları kullan DOĞRU/YANLıŞ Boole FALSE Modül yalnızca geçerli önbellek yoksa yürütülür; Aksi takdirde, önceki yürütmeden önbelleğe alınmış verileri kullanın.
Lütfen kimlik doğrulama türünü belirtin SAS/hesap AuthenticationType Hesap Erişim yetkilendirmesi için SAS veya hesap kimlik bilgilerinin kullan mı gerektiğini gösterir

Genel veya SAS - Genel depolama seçenekleri

Name Aralık Tür Varsayılan Description
Blob için SAS URI'si herhangi biri Dize yok Yazıldığı blob'un SAS URI'si (gerekli)
SAS dosyası için dosya biçimi ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Dosyanın CSV, TSV veya ARFF olduğunu gösterir. (gerekli)
SAS üst bilgi satırı yazma TRUE/FALSE Boole FALSE Sütun başlıklarını dosyaya yazmanın gerekip gerek olmadığını belirtir

Hesap - Özel depolama seçenekleri

Name Aralık Tür Varsayılan Description
Azure hesabı adı herhangi biri Dize yok Azure kullanıcı hesabı adı
Azure hesap anahtarı herhangi biri Securestring yok Azure depolama anahtarı
Kapsayıcıyla başlayan blob yolu herhangi biri Dize yok Kapsayıcı adıyla başlayan blob dosyasının adı
Azure Blob Depolama yazma modu Liste: Hata, Üzerine Yaz enum:BlobFileWriteMode Hata Blob dosyaları yazma yöntemini seçme
Blob dosyası için dosya biçimi ARFF

CSV

TSV
LoaderUtils.FileTypes CSV Blob dosyasının CSV, TSV veya ARFF olduğunu gösterir
Blob üst bilgi satırı yazma TRUE/FALSE Boole FALSE Blob dosyasının üst bilgi satırına sahip olup olmadığını gösterir

Özel durumlar

Özel durum Description
Hata 0027 İki nesne aynı boyutta olması gerektir ancak aynı boyutta değil olduğunda özel durum oluşur.
Hata 0003 Bir veya daha fazla giriş null veya boşsa özel durum oluşur.
Hata 0029 Geçersiz bir URI geçir olduğunda özel durum oluşur.
Hata 0030 içinde bir dosya indirilenemay olduğunda özel durum oluşur.
Hata 0002 Bir veya daha fazla parametre ayrıştırılana veya belirtilen türden hedef yöntemin gerekli türüne dönüştürülememesi bir özel durum oluşur.
Hata 0009 Azure depolama hesabı adı veya kapsayıcı adı yanlış belirtilirse özel durum oluşur.
Hata 0048 Bir dosyanın açılması mümkün değilken bir özel durum oluşur.
Hata 0046 Belirtilen yolda dizin oluşturulamaysa özel durum oluşur.
Hata 0049 Bir dosyayı ayrıştırmak mümkün değilken bir özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning kodları.

API özel durumlarının listesi için bkz. Machine Learning REST API Kodları.

Ayrıca bkz.

Verileri İçeri Aktarma
Verileri Dışarı Aktarma
Azure SQL Veritabanı
Hive Sorgusuna Aktarma
Azure Tablosuna Aktarma