Azure Blob Depolama dışarı aktar
Önemli
Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.
1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.
- makine öğrenimi projelerini ML Studio (klasik) konumundan Azure Machine Learning taşımaya yönelik bilgilerebakın.
- Azure Machine Learninghakkında daha fazla bilgi edinin.
ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.
bu makalede, Machine Learning Studio 'daki (klasik) verileri dışarı aktarma modülünde Azure Blob Depolama için dışarı aktar seçeneğinin nasıl kullanılacağı açıklanır.
Not
uygulama hedefi: yalnızca Machine Learning Studio (klasik)
benzer sürükle ve bırak modülleri Azure Machine Learning tasarımcısındakullanılabilir.
bu seçenek, Azure Blob Depolama bir machine learning denemesinin verilerini dışarı aktarmak istediğinizde yararlıdır. Örneğin, diğer uygulamalarla makine öğrenimi veri çıkışları paylaşmak veya diğer denemeleri kullanılmak üzere ara verileri veya Temizlenen veri kümelerini depolamak isteyebilirsiniz.
Azure Blob 'larına, HTTP veya HTTPS kullanılarak her yerden erişilebilir. Azure Blob Depolama yapılandırılmamış bir veri deposu olduğundan, verileri çeşitli biçimlerde dışa aktarabilirsiniz. Şu anda, CSV, TSV ve ARFF biçimleri destekleniyor.
verileri Azure blob 'a diğer uygulamalar tarafından kullanılmak üzere dışarı aktarmak için verileri dışarı aktar modülünü Azure Blob Depolama kaydetmek için kullanın. daha sonra, verileri yüklemek ve kullanmak için Azure depolama 'dan (Excel, bulut depolama yardımcı programları veya diğer bulut hizmetleri) veri okuyabilen herhangi bir aracı kullanın.
Not
Verileri Içeri aktarma ve dışarı aktarma modülleri yalnızca klasik dağıtım modeli kullanılarak oluşturulan Azure Storage 'dan verileri okuyabilir ve yazabilir. diğer bir deyişle, sık ve seyrek erişimli depolama erişim katmanları sunan yeni Azure Blob Depolama hesap türü henüz desteklenmiyor.
Genellikle, bu hizmet seçeneği sunulmadan önce oluşturmuş olabileceğiniz tüm Azure depolama hesapları etkilenmemelidir.
ancak, Machine Learning ile kullanmak için yeni bir hesap oluşturmanız gerekiyorsa, dağıtım modeliiçin klasik ' i seçmenizi veya Resource manager ' ı kullanmanızı ve hesap türüiçin, Blob depolamayerine genel amaçlı seçeneğini belirlemeniz önerilir.
Azure Blob Depolama verileri dışarı aktarma
Azure Blob hizmeti, ikili veriler de dahil olmak üzere büyük miktarda veriyi depolamaya yöneliktir. İki tür BLOB depolama alanı vardır: genel blob 'lar ve oturum açma kimlik bilgileri gerektiren Bloblar.
Veri dışa aktarma modülünü denemenize ekleyin. Bu modülü, Studio 'daki veri girişi ve çıkış kategorisinde bulabilirsiniz (klasik).
Bağlan dışarı aktarmak istediğiniz verileri üreten modüle verileri Azure Blob Depolama dışarı aktarın .
Verileri dışarı aktarÖzellikler bölmesini açın. veri hedefi için Azure Blob Depolama' yi seçin.
Bir SAS URL 'SI aracılığıyla depolamanın erişimi desteklediğini biliyorsanız kimlik doğrulama türüiçin ortak (SAS URL) öğesini seçin.
SAS URL 'SI, Azure Storage yardımcı programı kullanılarak oluşturulabilecek ve yalnızca sınırlı bir süre için kullanılabilen özel bir URL türüdür. Kimlik doğrulaması ve indirme için gereken tüm bilgileri içerir.
URIiçin, hesabı ve genel blobu TANıMLAYAN tam URI 'yi yazın veya yapıştırın.
Özel hesaplar için Hesap' ı seçin ve hesap adı ve hesap anahtarı ' nı belirtin, böylece deneme depolama hesabına yazabilir.
Hesap adı: verileri kaydetmek istediğiniz hesabın adını yazın veya yapıştırın. Örneğin, depolama hesabının tam URL 'SI ise
https://myshared.blob.core.windows.net
, yazmanızmyshared
gerekir.Hesap anahtarı: hesapla ilişkili depolama erişim anahtarını yapıştırın.
Kapsayıcı, dizin veya blob yolu: verilecek verilerin depolanacağı Blobun adını yazın. Örneğin, denemenizin sonuçlarını mymldataadlı bir hesaptaki kapsayıcı tahminlerininresults01.csv adlı yeni bir bloba kaydetmek için, Blobun tam URL 'si olur
https://mymldata.blob.core.windows.net/predictions/results01.csv
.Bu nedenle, kapsayıcı, dizin veya Blobun alan yolundakapsayıcı ve BLOB adını aşağıdaki gibi belirtirsiniz:
predictions/results01.csv
Zaten mevcut olmayan bir Blobun adını belirtirseniz Azure, blobu sizin için oluşturur.
mevcut bir bloba yazarken, özelliği ayarlayarak blob 'un geçerli içeriğinin üzerine yazılmasını belirtebilirsiniz Azure Blob Depolama yazma modu. Varsayılan olarak, bu özellik hataolarak ayarlanır, yani aynı ada sahip mevcut bir blob dosyası bulunduğunda hata oluşur.
BLOB dosyası Için dosya biçimiiçin verilerin depolanacağı biçimi seçin.
CSV: virgülle ayrılmış değerler (CSV) varsayılan depolama biçimidir. Sütun başlıklarını verilerle birlikte dışarı aktarmak için, BLOB üst bilgisi satırını yazseçeneğini belirleyin. Machine Learning ' de kullanılan virgülle ayrılmış biçim hakkında daha fazla bilgi için bkz. CSV 'ye dönüştürme.
TSV: sekmeyle ayrılmış değerler (TSV) biçimi birçok makine öğrenimi araçlarıyla uyumludur. Sütun başlıklarını verilerle birlikte dışarı aktarmak için, BLOB üst bilgisi satırını yazseçeneğini belirleyin. Machine Learning ' de kullanılan sekmeyle ayrılmış biçim hakkında daha fazla bilgi için bkz. TSV 'e dönüştürme.
Arff: Bu biçim dosyaları WEKA araç kümesi tarafından kullanılan biçimde kaydetmeyi destekler. Bu biçim bir SAS URL 'sinde depolanan dosyalar için desteklenmez. ARFF biçimi hakkında daha fazla bilgi için bkz. arff 'e dönüştürme.
Önbelleğe alınmış sonuçları kullan: denemeyi her çalıştırışınızda sonuçları blob dosyasına yeniden yazmayı önlemek istiyorsanız bu seçeneği belirleyin. Modül parametrelerinde başka bir değişiklik yoksa, deneme sonuçları yalnızca modülün ilk kez çalıştırıldığı zaman veya verilerde değişiklik olduğunda yazar.
Örnekler
Veri dışa aktarma modülünün nasıl kullanılacağına ilişkin örnekler için Azure yapay zeka Galerisibakın:
DataSet 'ı VW biçimine Dönüştür: Bu denemede, Vowpal Wabbit tarafından kullanılabilecek veri oluşturmak Için veri dışa aktarma modülüyle birlikte Python betiği kullanılır.
Azure SQL Data Warehouse kullanarak tahmine dayalı analiz işlem hatları ayarlama: bu senaryo, Machine Learning ve SQL Data Warehouse dahil olmak üzere birden çok bileşen arasındaki veri hareketini açıklar.
kod yok toplu işlem puanlama: bu öğreticide, denemeleri tarafından kullanılan verilerin içeri aktarılacağını otomatik hale getirmek ve blob depolamaya deneme sonuçları yazmak için Azure Logic Apps nasıl kullanabileceğiniz gösterilmektedir.
azure data factory kullanarak azure ML çözümünü şirket içi SQL Server ilehazırlama: bu makalede, bir geçici aşama olarak blob depolamayı kullanarak verileri şirket içi SQL Server veritabanına geri gönderen daha karmaşık bir veri işlem hattı açıklanmaktadır. Şirket içi bir veritabanının kullanılması için bir veri ağ geçidi yapılandırması gerekir, ancak örneğin bu bölümünü atlayabilir ve yalnızca blob depolamayı kullanabilirsiniz.
Teknik notlar
Bu bölümde, sık sorulan soruların uygulama ayrıntıları, ipuçları ve yanıtları yer almaktadır.
Sık sorulan sorular
Deneme değiştirilmediyse verilerin yazılmasını nasıl önleyebileceğiniz
Denemenizin sonuçları değiştiğinde, verileri dışarı aktar , her zaman yeni veri kümesini kaydeder. Ancak, çıkış verilerini etkileyen değişiklik yapmadan denemeyi tekrar tekrar çalıştırıyorsanız, önbelleğe alınmış sonuçları kullan seçeneğini belirleyebilirsiniz.
Modül, denemenin daha önce aynı verileri ve aynı seçenekleri kullanarak çalıştırıldığını denetler ve önceki bir çalıştırma bulunursa yazma işlemi yinelenmez.
Verileri farklı bir coğrafi bölgede bir hesaba kaydedebilir miyim
Evet, farklı bölgelerdeki hesaplara veri yazabilirsiniz. Ancak, depolama hesabı makine öğrenimi denemesi için kullanılan işlem düğümünden farklı bir bölgedeyse veri erişimi daha yavaş olabilir. Ayrıca, aboneliğin veri girişi ve çıkışı için ücretlendirilirsiniz.
Modül parametreleri
Genel seçenekler
Name | Aralık | Tür | Varsayılan | Description |
---|---|---|---|---|
Veri kaynağı | Liste | Veri kaynağı veya havuz | Azure Blob Depolama | hedef, azure BLOB depolama alanında bir dosya, bir azure tablosu, Azure SQL Veritabanı bir tablo veya görünüm ya da bir Hive tablosu olabilir. |
Önbelleğe alınmış sonuçları kullan | DOĞRU/YANLıŞ | Boole | FALSE | Modül yalnızca geçerli önbellek yoksa yürütülür; Aksi takdirde, önceki yürütmeden önbelleğe alınmış verileri kullanın. |
Lütfen kimlik doğrulama türünü belirtin | SAS/hesap | AuthenticationType | Hesap | Erişim yetkilendirmesi için SAS veya hesap kimlik bilgilerinin kullan mı gerektiğini gösterir |
Genel veya SAS - Genel depolama seçenekleri
Name | Aralık | Tür | Varsayılan | Description |
---|---|---|---|---|
Blob için SAS URI'si | herhangi biri | Dize | yok | Yazıldığı blob'un SAS URI'si (gerekli) |
SAS dosyası için dosya biçimi | ARFF CSV TSV |
LoaderUtils.FileTypes | CSV | Dosyanın CSV, TSV veya ARFF olduğunu gösterir. (gerekli) |
SAS üst bilgi satırı yazma | TRUE/FALSE | Boole | FALSE | Sütun başlıklarını dosyaya yazmanın gerekip gerek olmadığını belirtir |
Hesap - Özel depolama seçenekleri
Name | Aralık | Tür | Varsayılan | Description |
---|---|---|---|---|
Azure hesabı adı | herhangi biri | Dize | yok | Azure kullanıcı hesabı adı |
Azure hesap anahtarı | herhangi biri | Securestring | yok | Azure depolama anahtarı |
Kapsayıcıyla başlayan blob yolu | herhangi biri | Dize | yok | Kapsayıcı adıyla başlayan blob dosyasının adı |
Azure Blob Depolama yazma modu | Liste: Hata, Üzerine Yaz | enum:BlobFileWriteMode | Hata | Blob dosyaları yazma yöntemini seçme |
Blob dosyası için dosya biçimi | ARFF CSV TSV |
LoaderUtils.FileTypes | CSV | Blob dosyasının CSV, TSV veya ARFF olduğunu gösterir |
Blob üst bilgi satırı yazma | TRUE/FALSE | Boole | FALSE | Blob dosyasının üst bilgi satırına sahip olup olmadığını gösterir |
Özel durumlar
Özel durum | Description |
---|---|
Hata 0027 | İki nesne aynı boyutta olması gerektir ancak aynı boyutta değil olduğunda özel durum oluşur. |
Hata 0003 | Bir veya daha fazla giriş null veya boşsa özel durum oluşur. |
Hata 0029 | Geçersiz bir URI geçir olduğunda özel durum oluşur. |
Hata 0030 | içinde bir dosya indirilenemay olduğunda özel durum oluşur. |
Hata 0002 | Bir veya daha fazla parametre ayrıştırılana veya belirtilen türden hedef yöntemin gerekli türüne dönüştürülememesi bir özel durum oluşur. |
Hata 0009 | Azure depolama hesabı adı veya kapsayıcı adı yanlış belirtilirse özel durum oluşur. |
Hata 0048 | Bir dosyanın açılması mümkün değilken bir özel durum oluşur. |
Hata 0046 | Belirtilen yolda dizin oluşturulamaysa özel durum oluşur. |
Hata 0049 | Bir dosyayı ayrıştırmak mümkün değilken bir özel durum oluşur. |
Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning kodları.
API özel durumlarının listesi için bkz. Machine Learning REST API Kodları.
Ayrıca bkz.
Verileri İçeri Aktarma
Verileri Dışarı Aktarma
Azure SQL Veritabanı
Hive Sorgusuna Aktarma
Azure Tablosuna Aktarma