Aracılığıyla paylaş


Veri bilimciler için Ekip Veri Bilimi süreci

Bu makalede, Azure teknolojileriyle kapsamlı veri bilimi çözümleri uygularken belirlediğiniz hedefler için rehberlik sağlanır. Şu yollarda yönlendirilirsiniz:

  • Analiz iş yükünü anlama.
  • Takım Veri Bilimi İşlemi'ni (TDSP) kullanma.
  • Azure Machine Learning'i kullanma.
  • Veri aktarımı ve depolamanın temellerini anlama.
  • Veri kaynağı belgeleri sağlama.
  • Analiz işleme araçlarını kullanma.

Bu eğitim malzemeleri Team Veri Bilimi Process (TDSP) ve Microsoft açık kaynak yazılım ve araç setleriyle ilgilidir. Bu araçlar veri bilimi çözümleri tasarlamaya, yürütmeye ve sunmaya yardımcı olur.

Ders yolu

Kendi çalışmanıza yol göstermek için aşağıdaki tabloda yer alan öğeleri kullanabilirsiniz. Yolu izlemek için Açıklama'yı okuyun, çalışma başvurularını görmek için Konuyu seçin ve Bilgi denetimini kullanarak becerilerinizi denetleyin.

Hedefleme Konu Açıklama Bilgi Denetimi
Analitik proje geliştirme süreçlerini anlama Ekip Veri Bilimi sürecine giriş İlk olarak TDSP'ye genel bir bakış sunarız. Bu işlem, analiz projesinin her adımında size yol gösterir. süreç ve nasıl uygulayabileceğiniz hakkında daha fazla bilgi edinmek için bu bölümlerin her birini okuyun. TDSP proje yapısı yapıtlarını gözden geçirin ve projeniz için yerel makinenize indirin.
Çevik geliştirme TDSP birçok farklı programlama yöntemiyle iyi çalışır. Bu Öğrenme Yolu'nda Çevik yazılım geliştirmeyi kullanacağız. Çevik ile çalışmanın temellerini kapsayan "Çevik Geliştirme nedir?" ve "Çevik Kültür Oluşturma" makalelerini okuyun. Bu sitede daha fazla bilgi edinebileceğiniz başka başvurular da vardır. Bir iş arkadaşınıza sürekli tümleştirmeyi ve sürekli teslimi (CI/CD) açıklama.
Veri bilimi için DevOps Geliştirici işlemleri (DevOps), bir projede çalışmak ve çözümünüzü kuruluşun standart BT'sine tümleştirmek için kullanabileceğiniz kişileri, süreçleri ve platformları içerir. Bu tümleştirme benimseme, güvenlik ve güvenlik için gereklidir. Bu çevrimiçi kursta DevOps uygulamaları hakkında bilgi edinip sahip olduğunuz araç zinciri seçeneklerinden bazılarını anlayacaksınız. DevOps'un analiz projeleri için ne kadar önemli olduğunu teknik bir hedef kitleye 30 dakikalık bir sunu hazırlayın.
Veri depolama ve işleme teknolojilerini anlama Microsoft iş analizi ve yapay zeka Bu Öğrenme Yolu'nda analiz çözümü oluşturmak için kullanabileceğiniz birkaç teknolojiye odaklanıyoruz, ancak Microsoft'un çok daha fazlası var. Sahip olduğunuz seçenekleri anlamak için Microsoft Azure'da, Azure Stack'te ve şirket içi seçeneklerde kullanılabilen platformları ve özellikleri gözden geçirmek önemlidir. Analiz sorusunu yanıtlamak için kullanabileceğiniz çeşitli araçları öğrenmek için bu kaynağı gözden geçirin. Bu atölyeden sunu malzemelerini indirin ve gözden geçirin.
Eğitim, geliştirme ve üretim ortamlarınızı ayarlama ve yapılandırma Microsoft Azure Şimdi eğitim için Microsoft Azure'da bir hesap oluşturalım ve geliştirme ve test ortamları oluşturmayı öğrenelim. Bu ücretsiz eğitim kaynakları kullanmaya başlamanızı sağlar. Başlangıç ve Ara yollarını tamamlayın. Azure hesabınız yoksa bir hesap oluşturun. Azure portalında oturum açın ve eğitim için bir kaynak grubu oluşturun.
Azure komut satırı arabirimi (CLI) Visual Studio Code ve Visual Studio gibi grafik araçlardan Azure portalı gibi web arabirimlerine ve Azure PowerShell komutları ve işlevleri gibi komut satırından Azure ile çalışmanın birden çok yolu vardır. Bu makalede, iş istasyonunuzda, Windows'da ve diğer işletim sistemlerinde ve Azure portalında yerel olarak kullanabileceğiniz CLI'yı ele alacağız. Azure CLI ile varsayılan aboneliğinizi ayarlayın.
Azure Depolama Verilerinizi depolamak için bir yere ihtiyacınız vardır. Bu makalede Azure depolama seçenekleri, depolama hesabı oluşturma ve verileri buluta kopyalama veya buluta taşıma hakkında bilgi ediniyorsunuz. Daha fazla bilgi edinmek için bu giriş yazısını okuyun. Eğitim kaynak grubunuzda bir Depolama hesabı oluşturun, blob nesnesi için bir kapsayıcı oluşturun ve verileri karşıya yükleyip indirin.
Microsoft Entra ID Microsoft Entra Id, uygulamanızın güvenliğini sağlamanın temelini oluşturur. Bu makalede hesaplar, haklar ve izinler hakkında daha fazla bilgi ediniyorsunuz. Active Directory ve güvenlik karmaşık konulardır, bu nedenle temel bilgileri anlamak için bu kaynağı okuyun. Microsoft Entra Id'ye bir kullanıcı ekleyin. NOT: Aboneliğin yöneticisi değilseniz bu eylem için izinleriniz olmayabilir. Böyle bir durum söz konusuysa daha fazla bilgi edinmek için bu öğreticiyi gözden geçirin.
PyTorch için Azure Veri Bilimi Sanal Makinesi Birden çok işletim sisteminde yerel olarak veri bilimiyle çalışmaya yönelik araçları yükleyebilirsiniz. Ancak PyTorch için Veri Bilimi Sanal Makinesi ihtiyacınız olan tüm araçları ve birlikte çalışabileceğiniz birçok proje örneğini içerir. Bu makalede, PyTorch için Veri Bilimi Sanal Makinesi hakkında daha fazla bilgi edinecek ve örnekleriyle nasıl çalışacağınızı öğreneceksiniz. Bu kaynak, PyTorch için Veri Bilimi Sanal Makinesi, nasıl oluşturabileceğinizi ve onunla kod geliştirmeye yönelik birkaç seçeneği açıklar. Ayrıca bu öğrenme yolunu tamamlamak için ihtiyacınız olan tüm yazılımları içerir, bu nedenle bu konu için bilgi yolunu tamamladığınızdan emin olun. PyTorch için bir Veri Bilimi Sanal Makinesi oluşturun ve en az bir laboratuvarda çalışın.
Veri bilimi çözümleriyle çalışmaya yönelik araçları ve teknolojileri yükleme ve anlama Git ile çalışma DevOps işlemimizi TDSP ile takip etmek için bir sürüm denetimi sistemimiz olması gerekir. Machine Learning, popüler bir açık kaynak dağıtılmış depo sistemi olan Git'i kullanır. Bu makalede, Git'i ve merkezi bir depo olan GitHub'ı yükleme, yapılandırma ve bunlarla çalışma hakkında daha fazla bilgi edinacaksınız. Öğrenme yolu proje yapınız için bu GitHub projesini kopyalayın.
Visual Studio Code Visual Studio Code, birden çok dil ve Azure aracıyla kullanabileceğiniz platformlar arası tümleşik bir geliştirme ortamıdır (IDE). Çözümünüzün tamamını oluşturmak için bu tek ortamı kullanabilirsiniz. Başlamak için bu tanıtım videolarını izleyin. Visual Studio Code'u yükleyin ve etkileşimli düzenleyici oyun alanında Visual Studio Code özellikleriyle çalışın.
Python ile programlama Bu çözümde veri biliminin en popüler dillerinden biri olan Python'ı kullanacağız. Bu makalede Python ile analiz kodu yazmanın temelleri ve daha fazla bilgi edinmek için kaynaklar yer alır. Bu başvurunun 1-9. bölümlerinde çalışın ve bilginizi kontrol edin. Python kullanarak Azure tablosuna bir varlık ekleyin.
Jupyter Notebook ile çalışma Not defterleri, aynı belgeye metin ve kod eklemenin bir yoludur. Machine Learning not defterleriyle birlikte çalıştığından, bunların nasıl kullanılacağını anlamak yararlı olur. Bu öğreticiyi okuyun ve bilgi kontrolü bölümünde deneyin. Jupyter web sayfasını açın ve Python.ipynb'ye Hoş Geldiniz'i seçin. Bu sayfadaki örnekleri inceleyin.
Makine öğrenmesi Gelişmiş analiz çözümleri oluşturmak, yapay zeka ve derin öğrenme ile çalışmanın temelini oluşturan makine öğrenmesini kullanarak verilerle çalışmayı içerir. Bu kursta makine öğrenmesi hakkında daha fazla bilgi edinirsiniz. Veri bilimi hakkında kapsamlı bir kurs için bu sertifikasyona bakın. Makine öğrenmesi algoritmalarında bir kaynak bulun. (İpucu: "azure machine learning algoritması bilgi sayfasında" arama yapın)
scikit-learn scikit-learn araç kümesi, Python'da veri bilimi görevlerini gerçekleştirmenizi sağlar. Bu çerçeveyi çözümümüzde kullanırız. Bu makalede temel bilgiler ve daha fazla bilgi edinebileceğiniz yerler açıklanmaktadır. Iris veri kümesini kullanarak Pickle kullanarak bir SVM modelini kalıcı hale getirir.
Docker ile çalışma Docker, uygulama oluşturmak, göndermek ve çalıştırmak için kullanılan dağıtılmış bir platformdur ve makine öğrenmesinde sık sık kullanılır. Bu makale, bu teknolojinin temellerini kapsar ve daha fazla bilgi edinmek için nereye gidebileceğinizi açıklar. Visual Studio Code'u açın ve Docker uzantısını yükleyin. Basit bir Node Docker kapsayıcısı oluşturun.
Azure HDInsight HDInsight, Azure'da hizmet olarak kullanılabilen bir Hadoop açık kaynak altyapısıdır. Makine öğrenmesi algoritmalarınız büyük veri kümeleri içerebilir ve büyük ölçekli verileri depolamak, aktarmak ve işlemek için HDInsight'ı kullanabilirsiniz. Bu makale HDInsight ile çalışmayı kapsar. Küçük bir HDInsight kümesi oluşturun. HiveQL deyimlerini kullanarak sütunları /example/data/sample.log dosyasına yansıtın. Alternatif olarak, yerel sisteminizde bu bilgi denetimini tamamlayabilirsiniz.
İş gereksinimlerinden veri işleme akışı oluşturma TDSP'yi izleyen soruyu belirleme Geliştirme ortamının yüklü ve yapılandırılmış olması ve teknolojilerin ve süreçlerin anlaşılması sayesinde, analiz gerçekleştirmek için TDSP'yi kullanarak her şeyi bir araya getirmenin zamanı geldi. Soruyu tanımlayarak, veri kaynaklarını seçerek ve TDSP'deki adımların geri kalanını seçerek başlamalıyız. Bu işlemde çalışırken DevOps işlemini göz önünde bulundurun. Bu makalede, TDSP kullanarak çözümünüzü tanımlamak için kuruluşunuzdan gereksinimleri almayı ve uygulamanız aracılığıyla bir veri akışı haritası oluşturmayı öğreneceksiniz. "5 veri bilimi sorusu" üzerinde bir kaynak bulun ve kuruluşunuzun bu alanlarda sahip olabileceği bir soruyu açıklayın. Bu soru için hangi algoritmalara odaklanmalısınız?
Tahmine dayalı bir çözüm oluşturmak için Machine Learning'i kullanma Machine Learning Machine Learning, veri düzenleme ve özellik mühendisliği için yapay zeka kullanır, denemeleri yönetir ve model çalıştırmalarını izler. Tek bir ortam kullanır ve çoğu işlev yerel olarak veya Azure'da çalıştırılabilir. Denemelerinizi oluşturmak için PyTorch çerçevesini, TensorFlow çerçevesini veya diğer çerçeveleri kullanabilirsiniz. Bu makalede, şimdiye kadar öğrendiğiniz her şeyi kullanarak bu sürecin eksiksiz bir örneğine odaklanacağız.
Sonuçları görselleştirmek için Power BI kullanma Power BI Power BI bir veri görselleştirme aracıdır. Web cihazları, mobil cihazlar ve masaüstü bilgisayarlar gibi birden çok platformda kullanılabilir. Bu makalede, Azure Depolama sonuçlarına erişerek ve Power BI kullanarak görselleştirmeler oluşturarak oluşturduğunuz çözümün çıkışıyla çalışmayı öğreneceksiniz. Power BI'da bu öğreticiyi tamamlayın. Ardından Power BI'ı bir deneme çalıştırmasında oluşturulan blob CSV'ye bağlayın.
Çözümünüzü izleme Application Insights Uç çözümünüzü izlemek için kullanabileceğiniz birden çok araç vardır. Uygulama Analizler, yerleşik izlemeyi çözümünüzle tümleştirmeyi kolaylaştırır. Uygulamayı izlemek için Uygulama Analizler ayarlayın.
Azure İzleyici Günlükleri Uygulamanızı izlemenin bir diğer yöntemi de uygulamanızı DevOps işleminizle tümleştirmektir. Azure İzleyici Günlükleri, analiz çözümlerinizi dağıtıldıktan sonra izlemenize yardımcı olacak zengin bir özellik kümesi sağlar. Azure İzleyici Günlüklerini kullanma ile ilgili bu öğreticiyi tamamlayın.
Bu öğrenme yolunu tamamlayın Tebrikler! Bu öğrenme yolunu tamamladınız.

Katkıda Bulunanlar

Bu makale Microsoft tarafından yönetilir. Başlangıçta aşağıdaki katkıda bulunanlar tarafından yazılmıştır.

Asıl yazar:

Genel olmayan LinkedIn profillerini görmek için LinkedIn'de oturum açın.

Sonraki adımlar

Yapay zeka öğrenme merkezinde yapay zeka yolculuğunuza devam edin.