Aracılığıyla paylaş


Azure Tablosundan içeri aktarma

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Bu makalede, Azure tablolarından yapılandırılmış veya yarı yapılandırılmış verileri makine öğrenmesi denemesine içeri aktarmaya yönelik Machine Learning Studio'daki (klasik) Verileri İçeri Aktarma modülünün nasıl kullanımı açıklanmıştır.

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Azure tablo hizmeti , Azure'da büyük miktarlarda yapılandırılmış, ilişkisel olmayan verileri depolay bir veri yönetimi hizmetidir. Azure'ın içinden ve dışından kimliği doğrulanmış çağrıları kabul eden bir NoSQL veri deposu.

Azure tablo depolamadan içeri aktarma işlemi için iki hesap türü seçmeniz gerekir: SAS URL'si kullanılarak erişilebilen bir depolama hesabı veya oturum açma kimlik bilgileri gerektiren özel bir depolama hesabı.

Azure tablolarından verileri içeri aktarma

Veri İçeri Aktarma Sihirbazı'nı kullanma

Modülde depolama seçeneği seçmenize, mevcut abonelikler ve hesaplar arasından seçim yaptınız ve tüm seçenekleri hızlıca yapılandırmanıza yardımcı olan yeni bir sihirbaz bulunur.

  1. Denemenize Veri İçeri Aktarma modülünü ekleyin. Modülü Veri Girişi ve Çıkışı altında bulabilirsiniz.

  2. Verileri İçeri Aktarma Sihirbazı'nı Başlat'a tıklayın ve yönergeleri izleyin.

  3. Yapılandırma tamamlandığında, verileri denemenize gerçekten kopyalamak için modüle sağ tıklayın ve Seçili Çalıştır'ı seçin.

Mevcut bir veri bağlantısını düzenlemeniz gerekirse sihirbaz, sıfırdan yeniden başlamanız gerekmamak için önceki tüm yapılandırma ayrıntılarını yükler

Verileri İçeri Aktarma modülünde özellikleri el ile ayarlama

Aşağıdaki adımlarda, içeri aktarma kaynağının el ile nasıl yapılandırılacakları açıkmektedir.

  1. Denemenize Veri İçeri Aktarma modülünü ekleyin. Bu modülü, Machine Learning Studio'da (klasik) deneme öğeleri listesinde Veri Girişi ve Çıkış grubunda bulabilirsiniz.

  2. Veri kaynağı içinAzure Tablosu'seçin.

  3. Kimlik doğrulama türü için bilgilerin genel veri kaynağı olarak sağlandı olduğunu biliyorsanız Genel (SAS URL'si) seçin. SAS URL'si, Azure depolama yardımcı programını kullanarak oluşturabilirsiniz zaman bağlı erişim URL'dir.

    Aksi takdirde Hesap'ı seçin.

  4. Verileriniz SAS URL'si kullanılarak erişilebilen bir genel blobda yer aldısa, URL dizesi indirme ve kimlik doğrulaması için gereken tüm bilgileri içerdiği için ek kimlik bilgilerine ihtiyacınız yoktur.

    Tablo SAS URI'si alanına hesabı ve genel blobu tanımlayan tam URI'yi yazın veya yapıştırın.

    Not

    SAS URL'si ile erişilebilen bir sayfada veriler yalnızca şu biçimler kullanılarak depolanmış olabilir: CSV, TSV ve ARFF.

  5. Verileriniz özel bir hesapta ise , hesap adı ve anahtar da dahil olmak üzere kimlik bilgilerini sağlamak gerekir.

    • Tablo hesabı adı için, erişmek istediğiniz blobu içeren hesabın adını yazın veya yapıştırın.

      Örneğin, depolama hesabının tam URL'si ise https://myshared.table.core.windows.netyazın myshared.

    • Tablo hesabı anahtarı için depolama hesabıyla ilişkili erişim anahtarını yapıştırın.\

      Erişim anahtarını bilmiyorsanız, şu makaledeki "Depolama erişim anahtarlarını görüntüleme, kopyalama ve yeniden oluşturma" bölümüne bakın: Azure Depolama Hesapları hakkında.

    • Tablo adı için okumak istediğiniz tablonun adını yazın.

  6. Verileri İçeri Aktar'ın kaç satır taraması gerektiğini belirten bir seçenek belirleyin. Verileri İçeri Aktar, taramayı, verilerde sütun listesini almak ve sütun veri türlerinin ne olması gerektiğini belirlemek için kullanır.

    • TopN: Veri kümesinden başlayarak yalnızca belirtilen sayıda satırı tarayın.

      Varsayılan olarak 10 satır taranır, ancak TopN için Satır sayısı seçeneğini kullanarak bu değeri artırabilir veya azaltabilirsiniz .

      Veriler homojen ve tahmin edilebilirse TopN'yi seçin ve N için bir sayı girin. Büyük tablolar için bu, okuma sürelerinin daha hızlı tamamlansa da sonuçlandırabilirsiniz.

    • ScanAll: Tablodaki tüm satırları tarayın.

      Veriler tablonun derinliğine ve konumuna göre değişen özellik kümeleriyle yapılandırılmışsa tüm satırları taramak için ScanAll seçeneğini belirleyin. Bu, elde edilen özellik ve meta veri dönüştürmenizin bütünlüğünü sağlar.

  7. Deneme her çalıştırıldıklarında verilerin yenilenmesine gerek olup olmadığını belirtebilirsiniz. Önbelleğe alınmış sonuçları kullan seçeneğini (varsayılan) belirtirseniz, Verileri İçeri Aktarma modülü deneme ilk kez çalıştırıldıkında belirtilen kaynağı okur ve ardından sonuçları önbelleğe alın. Verileri İçeri Aktarma modülünün parametrelerinde herhangi bir değişiklik varsa veriler yeniden yüklenir.

    Bu seçeneğin işaretini kaldırsanız, deneme her çalıştırıldığında verilerin aynı olup olmadığı ne olursa olsun veriler kaynaktan okunur.

Örnekler

Verileri Dışarı Aktarma modülünü kullanma örnekleri için bkz. Azure Yapay Zeka Galerisi.

Teknik notlar

Bu bölümde uygulama ayrıntıları, ipuçları ve sık sorulan soruların yanıtları yer almaktadır.

Sık sorulan sorular

Aynı verileri gereksiz yere yeniden yüklemeden nasıl kaçınabilirsiniz?

Kaynak verileriniz değişirse, Verileri İçeri Aktar'ın yeniden çalıştırarak veri kümenizi yeniler ve yeni veriler eklersiniz. Ancak denemeyi her çalıştırsanız kaynaktan yeniden okumak istemiyorsanız Önbelleğe alınmış sonuçları kullan seçeneğini TRUE olarak belirleyin . Bu seçenek TRUE olarak ayarlanırsa, modül denemenin daha önce aynı kaynak ve aynı giriş seçeneklerini kullanarak çalıştırıp çalıştırma olmadığını denetler ve önceki bir çalıştırma bulunursa verileri kaynaktan yeniden yükleme yerine önbellekte veriler kullanılır.

Kaynaktan okunan verileri filtreleye miyim?

Verileri İçeri Aktarma modülü, veriler okundu olarak filtrelemeyi desteklemez. Bunun istisnası, bazen akış URL'sinin bir parçası olarak bir filtre koşulu belirtmenize olanak sağlayan veri akışlarından okumaktır.

Ancak, verileri Machine Learning Studio'da (klasik) okuduktan sonra değiştirebilir veya filtreleyebilirsiniz:

  • Verileri değiştirmek veya filtrelemek için özel R betiği kullanın.
  • Verileri Bölme modülünü göreli bir ifadeyle veya normal ifadeyle kullanarak istediğiniz verileri yalıtıp bir veri kümesi olarak kaydedin.

Not

Size gerekenden daha fazla veri yüklemiş olduğunu bulursanız, yeni bir veri kümesi okuyarak ve eski, daha büyük verilerle aynı adla kaydederek önbelleğe alınmış veri kümesi üzerine yazabilirsiniz.

Verileri İçeri Aktarma, farklı coğrafi bölgelerden yüklenen verileri nasıl işler?

Blob veya tablo depolama hesabı, makine öğrenmesi denemesi için kullanılan işlem düğümünden farklı bir bölgede bulunuyorsa veri erişimi daha yavaş olabilir. Ayrıca, abonelikte veri giriş ve çıkış için ücret tahsil edilecektir.

Tablomda bazı karakterler neden doğru görüntülenmiyor?

Machine Learning UTF-8 kodlamasını destekler. Tablonız başka bir kodlama kullanıyorsa karakterler doğru şekilde içe aktarılamayabilirsiniz.

İçeri aktarma sırasında değiştirilen yasak karakterler veya karakterler var mı?

Öznitelik verileri tırnak işaretleri veya atlandı karakter dizileri içeriyorsa, bu tür karakterlerin kuralları kullanılarak Microsoft Excel. Diğer tüm karakterler, aşağıdaki belirtimler bir kılavuz olarak kullanılarak ele alınan bir kılavuzdur: RFC 4180.

Modül parametreleri

Name Aralık Tür Varsayılan Varsayılan
Veri kaynağı Liste Veri kaynağı veya havuz Azure Blob Depolama Veri kaynağı HTTP, FTP, anonim HTTPS veya FTPS, Azure BLOB depolamadaki bir dosya, Azure tablosu, Azure SQL Veritabanı, şirket içi SQL Server veritabanı, Hive tablosu veya OData uç noktası olabilir.
Kimlik doğrulaması türü PublicOrSas

Hesap
tableAuthType Hesap Verilerin SAS URL'si aracılığıyla erişilebilen genel bir kapsayıcıda mı yoksa erişim için kimlik doğrulaması gerektiren bir özel depolama hesabında mı olduğunu belirtin.

Genel veya SAS - Genel depolama seçenekleri

Name Aralık Tür Varsayılan Description
Tablo URI'sı herhangi biri Dize
SAS aracılığıyla özellik adlarını taramak için satırlar tamsayı
SAS aracılığıyla TopN için satır sayısı

Hesap - Özel depolama seçenekleri

Name Aralık Tür Varsayılan Description
Tablo hesabı adı
Tablo hesabı anahtarı herhangi biri Securestring
Tablo adı herhangi biri
Özellik adlarını taramak için satırlar Topn

ScanAll
TopN için satır sayısı herhangi biri tamsayı

Çıkışlar

Ad Tür Description
Sonuç veri kümesi Veri Tablosu İndirilen verileri olan veri kümesi

Özel durumlar

Özel durum Description
Hata 0027 İki nesne aynı boyutta olması gerektir ancak aynı boyutta değil olduğunda özel durum oluşur.
Hata 0003 Bir veya daha fazla giriş null veya boşsa özel durum oluşur.
Hata 0029 Geçersiz bir URI geçir olduğunda özel durum oluşur.
Hata 0030 içinde bir dosya indirilenemay olduğunda özel durum oluşur.
Hata 0002 Bir veya daha fazla parametre ayrıştırılana veya belirtilen türden hedef yöntemin gerekli türüne dönüştürülememesi bir özel durum oluşur.
Hata 0009 Azure depolama hesabı adı veya kapsayıcı adı yanlış belirtilirse özel durum oluşur.
Hata 0048 Bir dosyanın açılması mümkün değilken bir özel durum oluşur.
Hata 0046 Belirtilen yolda dizin oluşturulamaysa özel durum oluşur.
Hata 0049 Bir dosyayı ayrıştırmak mümkün değilken bir özel durum oluşur.

Studio (klasik) modüllerine özgü hataların listesi için bkz. Machine Learning kodları.

API özel durumlarının listesi için bkz. Machine Learning REST API Kodları.

Ayrıca bkz.

Verileri İçeri Aktarma
Verileri Dışarı Aktarma
HTTP aracılığıyla Web URL’sinden içeri aktarma
Hive Sorgusundan içeri aktarma
Azure SQL Veritabanı’ndan içeri aktarma
Dosyadan içeri Azure Blob Depolama
Veri Akışı Sağlayıcılarından içeri aktarma
Şirket İçi Veritabanı'SQL Server aktarma