Aracılığıyla paylaş


Databricks'te yapay zeka ve makine öğrenmesi

Bu makalede, Mozaik yapay zekanın (eski adı Databricks Machine Learning) yapay zeka ve ML sistemleri oluşturmanıza yardımcı olmak için sağladığı araçlar açıklanmaktadır. Diyagramda, Databricks platformundaki çeşitli ürünlerin yapay zeka ve ML sistemleri oluşturup dağıtmak için uçtan uca iş akışlarınızı uygulamanıza nasıl yardımcı olduğu gösterilmektedir

Makine öğrenmesi diyagramı: Databricks'te model geliştirme ve dağıtım

Databricks'te üretken yapay zeka

Mozaik yapay zeka, yapay zeka yaşam döngüsünü veri toplama ve hazırlamadan geliştirme ve LLMOps modellerinden hizmet ve izlemeye kadar birleştirir. Aşağıdaki özellikler, üretken yapay zeka uygulamalarının geliştirilmesini kolaylaştırmak için özel olarak iyileştirilmiştir:

Üretken yapay zeka nedir?

Üretken yapay zeka, bilgisayarların görüntüler, metin, kod ve yapay veriler gibi içerik oluşturmak için modelleri kullanma yeteneğine odaklanan bir yapay zeka türüdür.

Üretken yapay zeka uygulamaları, büyük dil modelleri (LLM' ler) ve temel modeller olmak üzere üretken yapay zeka modellerinin üzerine kurulmuştur.

  • LLM'ler , dil işleme görevlerinde üstünlük sağlamak için çok büyük veri kümelerini kullanan ve eğiten derin öğrenme modelleridir. Eğitim verilerine göre doğal dili taklit eden yeni metin bileşimleri oluşturur.
  • Temel modeller , daha özel dil anlama ve oluşturma görevleri için ince ayar yapmak amacıyla önceden eğitilmiş büyük ML modelleridir. Bu modeller, giriş verileri içindeki desenleri ayırt etmek için kullanılır.

Bu modeller öğrenme süreçlerini tamamladıktan sonra, istendiğinde istatistiksel olarak olası çıkışlar oluşturur ve aşağıdakiler gibi çeşitli görevleri yerine getirmek için kullanılabilir:

  • Mevcut görüntüleri temel alan görüntü oluşturma veya yeni bir resim oluşturmak veya değiştirmek için bir görüntünün stilini kullanmak.
  • Transkripsiyon, çeviri, soru/yanıt oluşturma ve metnin amacını veya anlamını yorumlama gibi konuşma görevleri.

Önemli

Birçok LLM'nin veya diğer üretken yapay zeka modellerinin korumaları olsa da, yine de zararlı veya yanlış bilgiler oluşturabilir.

Üretken yapay zeka aşağıdaki tasarım desenlerine sahiptir:

  • İstem Mühendisliği: LLM davranışına kılavuzluk etmek için özel istemler oluşturma
  • Alma Artırılmış Nesil (RAG): Bir LLM'yi dış bilgi alma ile birleştirme
  • İnce ayar: Önceden eğitilmiş bir LLM'yi belirli etki alanı veri kümelerine uyarlama
  • Ön eğitim: LlM'yi sıfırdan eğitme

Databricks'te makine öğrenmesi

Mozaik AI ile tek bir platform, ham verilerden sunulan bir model için her isteği ve yanıtı kaydeden çıkarım tablolarına kadar ml geliştirme ve dağıtımının her adımına hizmet vermektedir. Veri bilimciler, veri mühendisleri, ML mühendisleri ve DevOps, aynı araçlar kümesini ve veriler için tek bir doğru kaynağını kullanarak işlerini yapabilir.

Mozaik yapay zeka, veri katmanını ve ML platformunu birleştirilir. Modeller ve işlevler gibi tüm veri varlıkları ve yapıtları bulunabilir ve tek bir katalogda yönetilir. Veri ve modeller için tek bir platform kullanmak, ham verilerden üretim modeline kadar kökenin izlenmesini mümkün kılar. Yerleşik veriler ve model izleme, kalite ölçümlerini platformda depolanan tablolara kaydederek model performansı sorunlarının kök nedenini belirlemeyi kolaylaştırır. Databricks'in tam ML yaşam döngüsünü ve MLOps'yi nasıl desteklediği hakkında daha fazla bilgi için bkz . Azure Databricks'te MLOps iş akışları ve MLOps Stacks: kod olarak model geliştirme işlemi.

Veri zekası platformunun temel bileşenlerinden bazıları şunlardır:

Görevler Bileşen
Verileri, özellikleri, modelleri ve işlevleri yönetin ve yönetin. Ayrıca bulma, sürüm oluşturma ve köken. Unity Kataloğu
Verilerde, veri kalitesinde ve model tahmini kalitesindeki değişiklikleri izleme Lakehouse İzleme, Çıkarım tabloları
Özellik geliştirme ve yönetim Özellik mühendisliği ve hizmet.
Modelleri eğitme Databricks AutoML, Databricks not defterleri
Model geliştirmeyi izleme MLflow izleme
Özel modeller sunma Mozaik Yapay Zeka Modeli Sunma.
Otomatik iş akışları ve üretime hazır ETL işlem hatları oluşturma Databricks İşleri
Git ile tümleştirme Databricks Git klasörleri

Databricks hakkında derin öğrenme

Derin öğrenme uygulamaları için altyapıyı yapılandırmak zor olabilir. Machine Learning için Databricks Runtime, TensorFlow, PyTorch ve Keras gibi en yaygın derin öğrenme kitaplıklarının yerleşik uyumlu sürümlerine sahip kümelerle bunu sizin için halleder.

Databricks Runtime ML kümeleri ayrıca sürücüler ve destekleyici kitaplıklarla önceden yapılandırılmış GPU desteği içerir. Ayrıca, ML iş akışlarını ve ML uygulamalarını ölçeklendirmek için işlem işlemeyi paralel hale getirmek için Ray gibi kitaplıkları da destekler.

Databricks Runtime ML kümeleri ayrıca sürücüler ve destekleyici kitaplıklarla önceden yapılandırılmış GPU desteği içerir. Mozaik AI Model Sunma , ek yapılandırma olmadan derin öğrenme modelleri için ölçeklenebilir GPU uç noktalarının oluşturulmasını sağlar.

Databricks, makine öğrenmesi uygulamaları için Machine Learning için Databricks Runtime çalıştıran bir küme kullanılmasını önerir. Bkz . Databricks Runtime ML kullanarak küme oluşturma.

Databricks'te derin öğrenmeye başlamak için bkz:

Sonraki adımlar

Başlamak için bkz:

Databricks Mozaik AI'de önerilen MLOps iş akışı için bkz:

Temel Databricks Mozaik yapay zeka özellikleri hakkında bilgi edinmek için bkz: