Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Şunlar için geçerlidir:
SQL Server 2019 ve önceki Analysis Services
Azure Analysis Services
Fabric/Power BI Premium
Önemli
Veri madenciliği SQL Server 2017 Analysis Services'da kullanım dışı bırakıldı ve artık SQL Server 2022 Analysis Services'da sonlandırıldı. Kullanım dışı bırakılan ve kullanımdan kaldırılan özellikler için belgeler güncelleştirilmez. Daha fazla bilgi edinmek için bkz. Analysis Services eski sürüm uyumluluğu.
Veri madenciliği (ve makine öğrenmesi) algoritması, verilerden bir model oluşturan bir dizi sezgisel ve hesaplamadır. Model oluşturmak için, algoritma ilk olarak sağladığınız verileri analiz eder ve belirli desen türlerini veya eğilimleri arar. Algoritma, madencilik modelini oluşturmak için en uygun parametreleri bulmak için birçok yinelemede bu analizin sonuçlarını kullanır. Bu parametreler daha sonra eyleme dönüştürülebilir desenleri ve ayrıntılı istatistikleri ayıklamak için veri kümesinin tamamına uygulanır.
Bir algoritmanın verilerinizden oluşturduğu madencilik modeli aşağıdakiler gibi çeşitli biçimlerde olabilir:
Bir veri kümesindeki vakaların nasıl ilişkili olduğunu açıklayan küme kümeleri.
Bir sonucu tahmin eden ve farklı ölçütlerin bu sonucu nasıl etkilediğini açıklayan bir karar ağacı.
Satışları tahmin eden matematiksel bir model.
Ürünlerin bir işlemde nasıl birlikte gruplandırıldığını ve ürünlerin birlikte satın alınma olasılığını açıklayan bir kural kümesi.
SQL Server Veri Madenciliği'nde sağlanan algoritmalar, verilerden desen türetmek için en popüler ve iyi araştırılan yöntemlerdir. Bir örnek vermek gerekirse, K ortalamaları kümeleme en eski kümeleme algoritmalarından biridir ve birçok farklı araçta ve birçok farklı uygulama ve seçenekte yaygın olarak kullanılabilir. Ancak, SQL Server Veri Madenciliğinde kullanılan K ortalamalar kümelemesinin belirli uygulaması Microsoft Research tarafından geliştirilmiş ve ardından SQL Server Analysis Services ile performans için iyileştirilmiştir. Sağlanan API'ler kullanılarak tüm Microsoft veri madenciliği algoritmaları kapsamlı bir şekilde özelleştirilebilir ve tamamen programlanabilir. Ayrıca Integration Services'deki veri madenciliği bileşenlerini kullanarak modellerin oluşturulmasını, eğitilmesi ve yeniden eğitilmesi işlemini otomatikleştirebilirsiniz.
Veri Madenciliği için OLE DB belirtimine uygun üçüncü taraf algoritmaları da kullanabilir veya hizmet olarak kaydedilebilen ve ardından SQL Server Veri Madenciliği çerçevesi içinde kullanılabilen özel algoritmalar geliştirebilirsiniz.
Doğru Algoritmayı Seçme
Belirli bir analitik görev için kullanılacak en iyi algoritmayı seçmek zor olabilir. Aynı iş görevini gerçekleştirmek için farklı algoritmalar kullanabilirsiniz ancak her algoritma farklı bir sonuç üretir ve bazı algoritmalar birden fazla sonuç türü üretebilir. Örneğin, Microsoft Karar Ağaçları algoritmasını yalnızca tahmin için değil, aynı zamanda bir veri kümesindeki sütun sayısını azaltmanın bir yolu olarak da kullanabilirsiniz, çünkü karar ağacı son madencilik modelini etkilemeyen sütunları tanımlayabilir.
Türe Göre Algoritma Seçme
SQL Server Veri Madenciliği aşağıdaki algoritma türlerini içerir:
Sınıflandırma algoritmaları , veri kümesindeki diğer özniteliklere göre bir veya daha fazla ayrı değişkeni tahmin eder.
Regresyon algoritmaları , veri kümesindeki diğer özniteliklere göre kar veya zarar gibi bir veya daha fazla sürekli sayısal değişkeni tahmin eder.
Segmentasyon algoritmaları , verileri benzer özelliklere sahip öğelerin gruplarına veya kümelerine ayırır.
İlişkilendirme algoritmaları , bir veri kümesindeki farklı öznitelikler arasındaki bağıntıları bulur. Bu tür bir algoritmanın en yaygın uygulaması, bir pazar sepeti analizinde kullanılabilen ilişkilendirme kuralları oluşturmaktır.
Sıra analizi algoritmaları , web sitesindeki bir dizi tıklama veya makine bakımı öncesinde bir dizi günlük olayı gibi verilerdeki sık dizileri veya bölümleri özetler.
Ancak çözümlerinizde tek bir algoritmayla sınırlı kalmanız için bir neden yoktur. Deneyimli analistler bazen en etkili girişleri (değişkenler) belirlemek için tek bir algoritma kullanır ve ardından bu verilere göre belirli bir sonucu tahmin etmek için farklı bir algoritma uygular. SQL Server Veri Madenciliği, tek bir madencilik yapısı üzerinde birden çok model oluşturmanıza olanak tanır. Bu sayede tek bir veri madenciliği çözümünde verileriniz üzerinde farklı görünümler elde etmek için kümeleme algoritması, karar ağacı modeli ve Naïve Bayes modeli kullanabilirsiniz. Ayrı görevleri gerçekleştirmek için tek bir çözüm içinde birden çok algoritma da kullanabilirsiniz: örneğin, finansal tahminler elde etmek için regresyon kullanabilir ve tahminleri etkileyen faktörlerin analizini gerçekleştirmek için bir sinir ağı algoritması kullanabilirsiniz.
Göreve Göre Algoritma Seçme
Belirli bir görevle kullanmak üzere bir algoritma seçmenize yardımcı olması için, aşağıdaki tabloda her algoritmanın geleneksel olarak kullanıldığı görev türlerine yönelik öneriler sağlanır.
| Görev örnekleri | Kullanılacak Microsoft algoritmaları |
|---|---|
|
Ayrık bir özniteliği tahmin etme: Potansiyel alıcılar listesindeki müşterileri iyi veya kötü potansiyel müşteriler olarak işaretleyin. Bir sunucunun sonraki 6 ay içinde başarısız olma olasılığını hesaplayın. Hasta sonuçlarını kategorilere ayırın ve ilgili faktörleri keşfedin. |
Microsoft Karar Ağaçları Algoritması Microsoft Naive Bayes Algoritması Microsoft Kümeleme Algoritması Microsoft Sinir Ağı Algoritması |
|
Sürekli bir özniteliği tahmin etme: Gelecek yılın satışlarını tahmin edin. Geçmiş geçmiş ve mevsimsel eğilimleri göz önünde bulundurarak site ziyaretçilerini tahmin edin. Demografik değerlere göre bir risk puanı oluşturun. |
Microsoft Karar Ağaçları Algoritması Microsoft Zaman Serisi Algoritması Microsoft Doğrusal Regresyon Algoritması |
|
Bir diziyi tahmin etme: Bir şirketin Web sitesinin tıklama akışı analizini gerçekleştirin. Sunucu hatasına neden olan faktörleri analiz edin. Yaygın etkinliklerle ilgili en iyi yöntemleri formüle etmek için, ayakta ziyaretler sırasında etkinliklerin dizilerini yakalayın ve analiz edin. |
Microsoft Sıralı Kümeleme Algoritması |
|
İşlemlerdeki ortak öğe gruplarını bulma: Ürün yerleşimini belirlemek için pazar sepeti analizini kullanın. Müşteriye satın almak üzere ek ürünler önerin. Gelecekteki etkinlikleri planlamak için ziyaretçilerden gelen anket verilerini analiz edin ve hangi etkinliklerin veya standların bağıntılı olduğunu bulun. |
Microsoft İlişkilendirme Algoritması Microsoft Karar Ağaçları Algoritması |
|
Benzer öğe gruplarını bulma: Demografik değerler ve davranışlar gibi özniteliklere göre hasta risk profilleri grupları oluşturun. Göz atma ve satın alma desenlerini kullanarak kullanıcıları analiz edin. Benzer kullanım özelliklerine sahip sunucuları belirleyin. |
Microsoft Kümeleme Algoritması Microsoft Sıralı Kümeleme Algoritması |
İlgili İçerik
Aşağıdaki bölümde, SQL Server Veri Madenciliği'nde sağlanan veri madenciliği algoritmalarının her biri için öğrenme kaynaklarına bağlantılar sağlanır:
Temel algoritma açıklaması: Algoritmanın ne yaptığını ve nasıl çalıştığını açıklar ve algoritmanın yararlı olabileceği olası iş senaryolarını özetler.
Teknik başvuru: Algoritmanın uygulanmasıyla ilgili teknik ayrıntıları ve gerekli akademik başvuruları sağlar. Algoritmanın davranışını denetlemek ve modeldeki sonuçları özelleştirmek için ayarlayabileceğiniz parametreleri listeler. Veri gereksinimlerini açıklar ve mümkünse performans ipuçları sağlar.
Model içeriği: Bilgilerin her veri madenciliği modeli türünde nasıl yapılandırıldığını ve düğümlerin her birinde depolanan bilgilerin nasıl yorumlandığını açıklar.
İlişkilendirme Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Kümeleme Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Karar Ağacı Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Doğrusal Regresyon Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Lojistik Regresyon Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Naive Bayes Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Sinir Ağı Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Sıralı Kümeleme Modelleri için Araştırma Modeli İçeriği (Analysis Services - Veri Madenciliği)
Zaman Serisi Modelleri için Madencilik Modeli İçeriği (Analysis Services - Veri Madenciliği)
Veri madenciliği sorguları: Her model türüyle kullanabileceğiniz birden çok sorgu sağlar. Örnek olarak modeldeki desenler hakkında daha fazla bilgi edinmenizi sağlayan içerik sorguları ve bu desenleri temel alan tahminler oluşturmanıza yardımcı olacak tahmin sorguları verilebilir.
İlgili Görevler
| Topic | Açıklama |
|---|---|
| Veri madenciliği modeli tarafından kullanılan algoritmayı belirleme | Madencilik Modeli Oluşturmak için Kullanılan Parametreleri Sorgulama |
| Özel Plug-In Algoritması Oluşturma | Eklenti Algoritmaları |
| Algoritmaya özgü görüntüleyici kullanarak modeli keşfetme | Veri Madenciliği Modeli Görüntüleyicileri |
| Genel tablo biçimi kullanarak modelin içeriğini görüntüleme | Microsoft Genel İçerik Ağacı Görüntüleyicisi'ni Kullanarak Modele Göz Atma |
| Verilerinizi ayarlama ve model oluşturmak için algoritmaları kullanma hakkında bilgi edinin |
Madencilik Yapıları (Analysis Services - Veri Madenciliği) Madencilik Modelleri (Analysis Services - Veri Madenciliği) |