Aracılığıyla paylaş


Veri Biçimi Dönüştürmeleri

Önemli

Machine Learning Stüdyosu (klasik) desteği 31 Ağustos 2024'te sona erecektir. Bu tarihe kadar Azure Machine Learning'e geçmenizi öneririz.

1 Aralık 2021'den başlayarak artık yeni Machine Learning Stüdyosu (klasik) kaynakları oluşturamayacaksınız. 31 Ağustos 2024'e kadar mevcut Machine Learning Stüdyosu (klasik) kaynaklarını kullanmaya devam edebilirsiniz.

ML Stüdyosu (klasik) belgeleri kullanımdan kaldırılacak ve gelecekte güncelleştirilmeyecektir.

Not

Uygulama: Machine Learning Studio (yalnızca klasik)

Benzer sürükle ve bırak modülleri tasarımcıda da Azure Machine Learning kullanılabilir.

Bu makalede, verileri makine öğrenmesinde kullanılan çeşitli dosya biçimleri arasında dönüştürmek için Machine Learning Studio'da (klasik) sağlanan modüller liste edilmektedir.

Desteklenen biçimler şunlardır:

  • Veriler boyunca kullanılan veri kümesi Machine Learning.
  • Weka tarafından kullanılan ARFF biçimi. Weka, açık kaynak Java tabanlı makine öğrenmesi algoritmaları kümesidir.
  • SVMLight biçimi. SVMLight biçimi, makine öğrenmesi için SVMlight çerçevesi için geliştirilmiştir. Ayrıca Vowpal Wabbit tarafından da kullanılabilir.
  • Çoğu ilişkisel veritabanı tarafından desteklenen sekmeyle ayrılmış (TSV ) ve virgülle ayrılmış (CSV) düz dosya biçimleri. Bu biçimler R ve Python tarafından da yaygın olarak de desteklemektedir.

Verileri bu biçimlere dönüştürerek sonuçları ve verileri farklı makine öğrenmesi çerçeveleri veya depolama mekanizmaları arasında daha kolay bir şekilde taşıyabilirsiniz.

Not

Bu veri dönüştürme modülleri yalnızca tam veri kümelerini belirtilen biçime dönüştürür. Herhangi bir tür dönüştürme, kesme, tarih-saat biçimlerini dönüştürme veya değerlerin diğer düzenlemelerini gerçekleştirmeniz gerekirse, Veri Dönüştürme'de modülleri kullanın veya ilgili görevlerin listesine bakın.

Yaygın veri dönüştürme senaryoları

Verileri bir denemeden başka bir makine öğrenmesi aracına veya platforma Machine Learning genellikle veri dönüştürme modüllerini kullanırsanız. Ayrıca modülleri kullanarak veri kaynağından verileri Machine Learning veya başka araçlar tarafından kullanılmaktadır. Örnek:

Görev Bunu kullanın
Veri kümesinde kullanmak veya bir veritabanına içeri aktarmak Excel bir ara veri kümesi kaydetmeniz gerekir. Verileri doğru biçimde hazırlamak için CSV modülünü veya TSV modülünü kullanın. Ardından, verileri indirin veya Azure Depolama.
Denemenizin verilerini R veya Python kodunda yeniden kullanmak istemeniz. Verileri hazırlamak için CSVmodülünü veya TSV modülünü kullanın. Ardından, veri kümesine erişmek için ihtiyacınız olan Python kodunu almak için dönüştürülmüş veri kümesine sağ tıklayın.
Denemenizi ve verilerinizi Weka ile Machine Learning. Verileri hazırlamak için ARFF modülünü kullanın. Ardından sonuçları indirin.
Verileri SVMlight çerçevesinde hazırlamalısiniz. Verileri hazırlamak için Convert to SVMLight modülünü kullanın. Ardından, elde edilen verileri indirin.
Vowpal Wabbit ile kullanmak üzere veri oluşturun. SVMLight biçimini kullanın. Ardından, dosyaları makalede açıklandığı gibi değiştirebilirsiniz. Dosyayı Azure Blob depolama alanına kaydediyor ve bu modülde Vowpal Wabbit modülüyle Machine Learning.
Veriler tablo biçiminde değildir. Veri Kümesine Dönüştürme modülünü kullanarak bunu bir veri kümesi biçimine itin .

Verileri tek tek sütunlarda içeri Machine Learning veya tek tek sütunlarda dönüştürmeniz gerekirse, veri dönüştürme işlemi gerçekleştirmeden önce şu modülleri kullanın:

Görev Bunu kullanın
Bilgisayarımdan verileri Machine Learning. Upload veri kümelerini Eğitim verilerinizi Machine Learning Studio'ya (klasik) aktarma konusunda açıklandığı gibi CSV biçiminde kullanın.
Hadoop veya Azure dahil olmak üzere bir bulut veri kaynağından verileri içeri aktarma. Verileri İçeri Aktarma modülünü kullanın.
Makine öğrenmesi veri kümelerini Azure Blob depolama alanına, Hadoop kümesine veya diğer bulut tabanlı depolama alanına kaydedin. Verileri Dışarı Aktarma modülünü kullanın.
Sütunların veri türünü değiştirme veya sütunları farklı bir biçime veya türe dönüştürme. Bu Machine Learning Meta Verileri Düzenle veya Dönüştürmemodüllerini SQL kullanın. R veya Python hakkında yeterli bilgiye sahipsiniz, Python Betiği Yürütme veya R Betiği Yürütme modüllerini deneyin.
Sayısal verileri yuvarlama, grupla veya normalleştirme. Matematik İşlemlerini Uygula, Verileri Depolara Grupla veya Verileri Normalleştir modüllerini kullanın.

Modül listesi

Veri Biçimi Dönüştürmeleri kategorisi şu modülleri içerir:

  • ARFF'ye dönüştürme: Veri girişini Weka araç seti tarafından kullanılan öznitelik ilişki dosyası biçimine dönüştürür.
  • CSV'ye dönüştürme: Veri kümelerini virgülle ayrılmış değerler biçimine dönüştürür.
  • Veri Kümesine Dönüştürme: Veri girişini veri kümesi tarafından kullanılan iç veri kümesi biçimine Machine Learning.
  • SVMLight'a dönüştürme: Veri girişini SVMlight çerçevesi tarafından kullanılan biçime dönüştürür.
  • TSV'ye dönüştürme: Veri girişini sekmeyle ayrılmış biçime dönüştürür.

Ayrıca bkz.