Aracılığıyla paylaş


Azure AI Studio projenize veri ekleme ve yönetme

Önemli

Bu makalede açıklanan özelliklerden bazıları yalnızca önizleme aşamasında kullanılabilir. Bu önizleme, hizmet düzeyi sözleşmesi olmadan sağlanır ve üretim iş yükleri için önerilmez. Bazı özellikler desteklenmiyor olabileceği gibi özellikleri sınırlandırılmış da olabilir. Daha fazla bilgi için bkz. Microsoft Azure Önizlemeleri Ek Kullanım Koşulları.

Bu makalede, Azure AI Studio'da veri oluşturma ve yönetme işlemleri açıklanmaktadır. Veriler Azure AI Studio'da dizin oluşturma için kaynak olarak kullanılabilir.

Veriler, şu özelliklere ihtiyacınız olduğunda size yardımcı olabilir:

  • Sürüm oluşturma: Veri sürümü oluşturma desteklenir.
  • Yeniden üretilebilirlik: Veri sürümü oluşturduktan sonra sabittir. Değiştirilemez veya silinemez. Bu nedenle, verileri kullanan işler veya istem akışı işlem hatları yeniden oluşturulabilir.
  • Denetlenebilirlik: Veri sürümü sabit olduğundan varlık sürümlerini, sürümü güncelleştirenleri ve sürüm güncelleştirmelerinin ne zaman gerçekleştiğini izleyebilirsiniz.
  • Köken: Belirli veriler için, hangi işlerin veya istem akışı işlem hatlarının verileri tükettiğine bakabilirsiniz.
  • Kullanım kolaylığı: Azure AI Studio verileri web tarayıcısı yer işaretlerine (sık kullanılanlar) benzer. Azure Depolama'da sık kullanılan verilerinize başvuran uzun depolama yollarını hatırlamak yerine, bir veri sürümü oluşturabilir ve varlığın bu sürümüne kolay bir adla erişebilirsiniz.

Önkoşullar

Veri oluşturmak ve verilerle çalışmak için şunları yapmanız gerekir:

  • Azure aboneliği. Aboneliğiniz yoksa başlamadan önce ücretsiz bir hesap oluşturun.

  • AI Studio projesi.

Veri oluşturma

Verilerinizi oluştururken veri türünü ayarlamanız gerekir. AI Studio üç veri türünü destekler:

Tür Kurallı Senaryolar
file
Tek bir dosyaya başvurma
Azure Depolama'da tek bir dosyayı okuyun (dosya herhangi bir biçime sahip olabilir).
folder
Klasöre başvurma
Pandas/Spark'ta parquet/CSV dosyalarının bir klasörünü okuyun.

Bir klasörde bulunan yapılandırılmamış verileri (görüntüler, metin ve ses gibi) okuyun.

Azure AI Studio desteklenen kaynak yollarını gösterir. Bir klasörden veya dosyadan veri oluşturabilirsiniz:

  • Klasör türünü seçerseniz, klasör URL biçimini seçebilirsiniz. Azure AI Studio desteklenen klasör URL biçimlerini gösterir. Aşağıdaki gibi bir veri kaynağı oluşturabilirsiniz: Klasör URL biçiminin ekran görüntüsü.

  • Dosya türünü seçerseniz, dosya URL'si biçimini seçebilirsiniz. Desteklenen dosya URL biçimleri Azure AI Studio'da gösterilir. Aşağıdaki gibi bir veri kaynağı oluşturabilirsiniz: Dosya URL'si biçiminin ekran görüntüsü.

Veri oluşturma: Dosya türü

Bir dosya (uri_file) veri kaynağı türü, depolamadaki tek bir dosyayı (örneğin, csv dosyası) gösterir.

Bu adımlar, Azure AI Studio'da Dosya türündeki verilerin nasıl oluşturulacağını açıklar:

  1. Azure AI Studio'ya gidin

  2. Soldaki daraltılabilir menüden Bileşenler'in altında Veri'yi seçin. Yeni Veri'yi seçin. Ekran görüntüsü, Veri sekmesinde Veri Ekle'yi vurgular.

  3. Veri kaynağınızı seçin. Veri kaynağı seçmek için üç seçeneğiniz vardır.

    • Mevcut Bağlan ions'dan veri seçebilirsiniz.
    • Depolama hesabına veya genel erişime açık bir HTTPS sunucusuna doğrudan URL'niz varsa Depolama URL ile veri al'ı seçebilirsiniz.
    • Yerel sürücünüzden klasör yüklemek için Dosyaları/klasörleri karşıya yükle'yi seçebilirsiniz.

    Bu ekran görüntüsünde mevcut bağlantılar gösterilir.

    • Mevcut Bağlan: Var olan bir bağlantıyı seçebilir, bu bağlantıya göz atabilir ve ihtiyacınız olan bir dosyayı seçebilirsiniz. Mevcut bağlantılar sizin için işe yaramazsa sağ üst köşeden Yeni bağlantı düğmesini seçin. Bu ekran görüntüsü, bir dış varlığa yeni bir bağlantı oluşturulmasını gösterir.

    • Depolama URL'si ile veri alma: Tür'leri "Dosya" olarak seçebilir ve ardından bu sayfada listelenen desteklenen URL biçimlerini temel alan bir URL sağlayabilirsiniz. Bu ekran görüntüsü, dosyaya işaret eden bir URL'nin sağlanmasını gösterir.

    • Dosyaları/klasörleri karşıya yükleme: Dosyaları veya klasörü karşıya yükle'yi, Dosyaları karşıya yükle'yi ve karşıya yüklenecek yerel dosyayı seçebilirsiniz. Dosya varsayılan "workspaceblobstore" bağlantısına yüklenir. Bu ekran görüntüsünde dosyaları/klasörleri karşıya yükleme adımı gösterilmektedir.

    1. Veri kaynağını seçtikten sonra İleri'yi seçin.

    2. Verileriniz için özel bir ad girin ve Oluştur'u seçin.

    Bu ekran görüntüsü, veri kaynağının adlandırma adımını gösterir.

Veri oluşturma: Klasör türü

Klasör (uri_folder) veri kaynağı türü, depolama kaynağındaki bir klasörü (örneğin, birkaç resim alt klasörünü içeren bir klasör) işaret eder. Azure AI Studio'da Klasör türü veri kaynağı oluşturmak için şu adımları kullanın:

  1. Azure AI Studio'ya gidin

  2. Soldaki daraltılabilir menüden Bileşenler'in altında Veri'yi seçin. Yeni Veri'yi seçin.

    Ekran görüntüsü, Veri sekmesinde Veri Ekle'yi vurgular.

  3. Veri kaynağınızı seçin. Üç veri kaynağı seçeneğiniz vardır:

    1. Mevcut Bağlan ions'dan veri seçme

    2. Depolama hesabına veya genel erişime açık bir HTTPS sunucusuna doğrudan URL'niz varsa Depolama URL ile veri al'ı seçin

    3. Yerel sürücünüzden klasör yüklemek için Dosyaları/klasörleri karşıya yükle'yi seçin

      Bu ekran görüntüsünde mevcut bağlantılar gösterilir.

    • Mevcut Bağlan: Var olan bir bağlantıyı seçip bu bağlantıya göz atabilir ve ihtiyacınız olan dosyayı seçebilirsiniz. Mevcut bağlantılar sizin için işe yaramazsa, sağ tarafta Yeni bağlantı düğmesini seçebilirsiniz.

      Bu ekran görüntüsünde, var olan bir bağlantıdan klasör seçme adımı gösterilmektedir.

    • Depolama URL'si ile veri alma: Tür'leri "Klasör" olarak seçebilir ve bu sayfada listelenen desteklenen URL biçimlerini temel alan bir URL sağlayabilirsiniz.

      Bu ekran görüntüsü, bir klasöre işaret eden bir URL sağlama adımını gösterir.

    • Dosyaları/klasörleri karşıya yükleme: Dosyaları veya klasörü karşıya yükle'yi, Dosyaları karşıya yükle'yi ve karşıya yüklenecek yerel dosyayı seçebilirsiniz. Dosya kaynakları varsayılan "workspaceblobstore" bağlantısına yüklenir.

      Bu ekran görüntüsünde dosyaları/klasörleri karşıya yükleme adımı gösterilmektedir.

  4. Veri kaynağını seçtikten sonra İleri'yi seçin.

  5. Verileriniz için özel bir ad girin ve Oluştur'u seçin.

    Verileri adlandırma işleminin ekran görüntüsü.

Verileri yönetme

Veri silme

Önemli

Veri silme desteklenmez. Veriler AI Studio'da sabittir. Veri sürümü oluşturduktan sonra değiştirilemez veya silinemez. Bu değişmezlik, üretim iş yükleri oluşturan bir ekipte çalışırken bir koruma düzeyi sağlar.

AI Studio veri silmeye izin verirse aşağıdaki olumsuz etkileri olacaktır:

  • Daha sonra silinen verileri kullanan üretim işleri başarısız olur.
  • Makine öğrenmesi denemelerinin çoğaltılması daha zor hale gelebilir.
  • silinen veri sürümünü görüntülemek imkansız hale geleceği için iş kökeni bozulacaktı.
  • Sürümler eksik olabileceğinden artık doğru şekilde izleyemediniz ve denetleyemediniz.

Hatalı bir şekilde bir veri kaynağı oluşturulduğunda (örneğin, yanlış bir ad, tür veya yol ile) Azure AI, silme işleminin olumsuz sonuçları olmadan durumu işlemeye yönelik çözümler sunar:

Verileri silmek isteme nedeniniz Çözüm
Ad yanlış Verileri arşivle
Ekip artık verileri kullanmıyor Verileri arşivle
Veri listesini karmaşık hale getirmek için Verileri arşivle
Yol yanlış Doğru yola sahip verilerin yeni bir sürümünü (aynı ad) oluşturun. Daha fazla bilgi için Bkz . Veri oluşturma.
Yanlış bir türe sahip Şu anda Azure AI, ilk sürüme kıyasla farklı türde yeni bir sürüm oluşturulmasına izin vermiyor.
(1) Verileri arşivle
(2) Doğru türe sahip farklı bir ad altında yeni bir veri oluşturun.

Verileri arşivle

Varsayılan olarak, bir veri kaynağını arşivleme, bunu hem liste sorgularından (örneğin, CLI'da az ml data list) hem de Azure AI Studio'daki veri listesinden gizler. İş akışlarınızda arşivlenmiş bir veri kaynağına başvurmaya ve kullanmaya devam edebilirsiniz. Aşağıdakilerden birini arşivleyebilirsiniz:

  • belirli bir ad altındaki verilerin tüm sürümleri
  • belirli bir veri sürümü

Verilerin tüm sürümlerini arşivle

Şu anda Azure AI Studio, veri kaynağının tüm sürümlerini belirli bir ad altında arşivlemeyi desteklemez.

Belirli bir veri sürümünü arşivle

Şu anda Azure AI Studio, veri kaynağının belirli bir sürümünü arşivlemeyi desteklemez.

Arşivlenmiş verileri geri yükleme

Arşivlenmiş bir veri kaynağını geri yükleyebilirsiniz. Verilerin tüm sürümleri arşivlenmişse, verilerin tek tek sürümlerini geri yükleyemezsiniz. Tüm sürümleri geri yüklemeniz gerekir.

Verilerin tüm sürümlerini geri yükleme

Şu anda Azure AI Studio, verilerin belirli bir ad altındaki tüm sürümlerinin geri yüklenmesini desteklemez.

Belirli bir veri sürümünü geri yükleme

Önemli

Tüm veri sürümleri arşivlendiyse, verilerin tek tek sürümlerini geri yükleyemezsiniz. Tüm sürümleri geri yüklemeniz gerekir.

Azure AI Studio şu anda belirli bir veri sürümünün geri yüklenmesini desteklememektedir.

Veri etiketleme

Veri etiketleme, anahtar-değer çifti biçiminde verilere uygulanan ek meta verilerdir. Veri etiketleme birçok avantaj sağlar:

  • Veri kalitesi açıklaması. Örneğin, kuruluşunuz bir madalyon göl evi mimarisi kullanıyorsa varlıkları (ham), medallion:silver (doğrulanmış) ve medallion:gold (zenginleştirilmiş) etiketleyebilirsiniz medallion:bronze .
  • Veri bulmaya yardımcı olmak için verimli veri arama ve filtreleme sağlar.
  • Veri erişimini düzgün bir şekilde yönetmek ve yönetmek için hassas kişisel verilerin tanımlanmasına yardımcı olur. Örneğin, sensitivity:PII/sensitivity:nonPII.
  • Sorumlu bir yapay zeka (RAI) denetiminden verilerin onaylanıp onaylanmamış olduğunu belirleyin. Örneğin, RAI_audit:approved/RAI_audit:todo.

Mevcut verilere etiket ekleyebilirsiniz.

Veri önizleme

Veri ayrıntıları sayfasında klasör yapısına göz atabilir ve dosyanın önizlemesini görüntüleyebilirsiniz. Aşağıdaki türler için veri önizlemesini destekliyoruz:

  • Veri dosyası türleri önizleme API'si aracılığıyla desteklenir: ".tsv", ".csv", ".parquet", ".jsonl".
  • Diğer dosya türleri olan Studio kullanıcı arabirimi, dosyayı tarayıcıda yerel olarak önizlemeye çalışır. Bu nedenle desteklenen dosya türleri tarayıcının kendisine bağlı olabilir. Normalde görüntüler için şunlar desteklenir: ".png", ".jpg", ".gif". Ve normalde bunlar ".ipynb", ".py", ".yml", ".html" desteğidir.

Sonraki adımlar