Aracılığıyla paylaş


Azure Synapse Analytics'te Makine Öğrenmesi özellikleri

Azure Synapse Analytics çeşitli makine öğrenmesi özellikleri sunar. Bu makalede, Azure Synapse bağlamında Machine Learning'i nasıl uygulayabileceğinize ilişkin bir genel bakış sağlanır.

Bu genel bakış, synapse'teki makine öğrenmesi ile ilgili veri bilimi süreci perspektifinden farklı özellikleri kapsar.

Tipik bir veri bilimi sürecinin nasıl göründüğünü biliyor olabilirsiniz. Makine öğrenmesi projelerinin çoğunun izlediği iyi bilinen bir süreçtir.

İşlem, üst düzeyde aşağıdaki adımları içerir:

  • İş anlayışı (bu makalede ele alınmadı)
  • Veri edinme ve anlama
  • Modelleme
  • Model dağıtımı ve puanlama

Bu makalede, veri bilimi süreci açısından farklı analiz altyapılarındaki Azure Synapse makine öğrenmesi özellikleri açıklanmaktadır. Veri bilimi sürecindeki her adım için yardımcı olabilecek Azure Synapse özellikleri özetlenir.

Veri edinme ve anlama

Makine öğrenmesi projelerinin çoğu iyi oluşturulmuş adımlar içerir ve bu adımlardan biri de verilere erişmek ve bunları anlamaktır.

Veri kaynağı ve işlem hatları

Azure Synapse'in yerel olarak tümleştirilmiş bir parçası olan Azure Data Factory sayesinde, veri alımı ve veri düzenleme işlem hatları için kullanabileceğiniz güçlü bir araç kümesi vardır. Bu, verilere erişmek ve bunları makine öğrenmesi için kullanılabilecek bir biçime dönüştürmek için kolayca veri işlem hatları oluşturmanıza olanak tanır. Synapse'teki veri işlem hatları hakkında daha fazla bilgi edinin.

Veri hazırlama ve keşfetme/görselleştirme

Makine öğrenmesi sürecinin önemli bir parçası, verileri araştırma ve görselleştirmelerle anlamaktır.

Verilerin nerede depolandığına bağlı olarak Synapse, analiz ve makine öğrenmesi için keşfetmek ve hazırlamak için bir dizi farklı araç sunar. Veri keşfetmeye başlamanın en hızlı yollarından biri Apache Spark veya sunucusuz SQL havuzlarını doğrudan veri gölündeki veriler üzerinden kullanmaktır.

  • Azure Synapse için Apache Spark, verilerinizi büyük ölçekte dönüştürmeye, hazırlamaya ve keşfetmeye yönelik özellikler sunar. Bu spark havuzları, büyük ölçekte veri işleme için PySpark/Python, Scala ve .NET gibi araçlar sunar. Güçlü görselleştirme kitaplıkları kullanılarak, verilerin daha iyi anlaşılmasına yardımcı olmak için veri keşfetme deneyimi geliştirilebilir. Spark kullanarak Synapse'te verileri keşfetme ve görselleştirme hakkında daha fazla bilgi edinin.

  • Sunucusuz SQL havuzları , doğrudan veri gölü üzerinden TSQL kullanarak verileri keşfetmenin bir yolunu sunar. Sunucusuz SQL havuzları, Synapse Studio'da bazı yerleşik görselleştirmeler de sunar. Sunucusuz SQL havuzlarıyla verileri keşfetme hakkında daha fazla bilgi edinin.

Modelleme

Azure Synapse'te, Apache Spark Havuzlarında PySpark/Python, Scala veya .NET gibi araçlarla eğitim makine öğrenmesi modelleri gerçekleştirilebilir.

MLlib ile Spark Havuzlarında modelleri eğitin

Makine öğrenmesi modelleri çeşitli algoritmaların ve kitaplıkların yardımıyla eğitilebilir. Spark MLlib , klasik makine öğrenmesi sorunlarının çoğunu çözmeye yardımcı olabilecek ölçeklenebilir makine öğrenmesi algoritmaları sunar. Synapse'te MLlib kullanarak model eğitmeye yönelik bir öğretici için bkz . Apache Spark MLlib ve Azure Synapse Analytics ile makine öğrenmesi uygulaması oluşturma.

MLlib'e ek olarak, Scikit Learn gibi popüler kitaplıklar da model geliştirmek için kullanılabilir. Synapse Spark Havuzlarına kitaplık yükleme hakkında ayrıntılı bilgi için bkz . Azure Synapse Analytics'te Apache Spark kitaplıklarını yönetme.

Model dağıtımı ve puanlama

Azure Synapse'te veya Azure Synapse dışında eğitilmiş modeller toplu puanlama için kolayca kullanılabilir. Şu anda Synapse'te toplu puanlama çalıştırmanın iki yolu vardır.

SynapseML

SynapseML (eski adıyla MMLSpark), yüksek düzeyde ölçeklenebilir makine öğrenmesi (ML) işlem hatlarının oluşturulmasını kolaylaştıran açık kaynak bir kitaplıktır. Apache Spark çerçevesini birkaç yeni yönde genişletmek için kullanılan bir araç ekosistemidir. SynapseML, mevcut çeşitli makine öğrenmesi çerçevelerini ve yeni Microsoft algoritmalarını Python, R, Scala, .NET ve Java'da kullanılabilen tek ve ölçeklenebilir bir API'de birleştirir. Daha fazla bilgi edinmek için SynapseML'nin temel özelliklerine bakın.