Databricks Özellik Mağazası

Bu sayfa, Unity Kataloğu ile Databricks Özellik Deposu'nu kullandığınızda kullanılabilen özelliklere genel bir bakış sağlar.

Databricks Özellik Deposu, yapay zeka ve ML modellerinizde kullanılan özellikler için merkezi bir kayıt defteri sağlar. Özellik tabloları ve modelleri Unity Kataloğu'nda kayıtlıdır ve yerleşik idare, köken ve çalışma alanları arası özellik paylaşımı ve bulma sağlar. Databricks ile model eğitim iş akışının tamamı aşağıdakiler dahil olmak üzere tek bir platformda gerçekleşir:

  • Ham verileri alan, özellik tabloları oluşturan, modelleri eğiten ve toplu çıkarım gerçekleştiren veri işlem hatları.
  • Tek tıklamayla kullanılabilen ve milisaniyelik gecikme süresi sağlayan model ve özellik sunma uç noktaları.
  • Veri ve model izleme.

Modelleri eğitmek için Databricks Özellik Deposu'ndaki özellikleri kullandığınızda model, eğitimde kullanılan özelliklere göre kökeni otomatik olarak izler. Çıkarım zamanında model otomatik olarak en son özellik değerlerini arar. Databricks Özellik Deposu, tüm özellik hesaplama görevlerini işleyen gerçek zamanlı uygulamalar için isteğe bağlı olarak özellik hesaplaması da sağlar. Bu, eğitim/hizmet dengesizliğini ortadan kaldırarak çıkarımda kullanılan özellik hesaplamalarının model eğitimi sırasında kullanılanlarla aynı olmasını sağlar. Ayrıca tüm özellik aramaları ve hesaplamaları Databricks Özellik Deposu tarafından işlenmek üzere istemci tarafı kodunu önemli ölçüde basitleştirir.

Uyarı

Bu sayfada Unity Kataloğu için etkinleştirilmiş çalışma alanları için Databricks Özellik Deposu açıklanmaktadır. Çalışma alanınız Unity Kataloğu için etkinleştirilmemişse bkz . Çalışma Alanı Özellik Deposu (kullanım dışı).

Kavramsal genel bakış

Databricks Özellik Deposu'nun nasıl çalıştığına genel bakış ve terimler sözlüğü için bkz. Özellik Deposu'na genel bakış ve sözlük.

Özellik geliştirme

Özellik Description
Özellik tabloları Özellik tabloları oluşturun ve bunlarla çalışın.

Özellikleri keşfetme ve paylaşma

Özellik Description
Unity Kataloğu'ndaki özellikleri keşfetme Katalog Gezgini'ni ve Özellikler kullanıcı arabirimini kullanarak özellik tablolarını keşfedin ve yönetin.
Unity Kataloğu'nda etiketleri, özellik tabloları ve özelliklerle birlikte kullanma Özellik tablolarınızı ve özelliklerinizi kategorilere ayırmak ve yönetmek için basit anahtar-değer çiftlerini kullanın.

Eğitim iş akışlarında özellikleri kullanma

Özellik Description
Özellik tabloları ile modelleri eğitin Modelleri eğitmek için özellikleri kullanın.
Zaman noktasındaki özellik birleşimleri Etiket gözleminin kaydedildiği zamandaki özellik değerlerini yansıtan bir eğitim veri kümesi oluşturmak için zamana özgü doğruluğu kullanın.
Python API'si Python API referansı

Hizmet özellikleri

Özellik Description
Databricks Online Özellik Mağazalar Özellik verilerini çevrimiçi uygulamalara ve gerçek zamanlı makine öğrenmesi modellerine sunma. Databricks Lakebase tarafından desteklenir.
Otomatik özellik arama ile Model Sunma Bir çevrimiçi veri deposundan özellik değerlerini otomatik olarak arayın.
Özellik Sunma uç noktaları Databricks dışındaki modellere ve uygulamalara özellik sunma.
İsteğe bağlı özellik hesaplaması Çıkarım sırasında özellik değerlerini hesaplayın.

Özellik yönetimi ve soy izleme

Özellik Description
Özellik idaresi ve köken Özellik tablolarına erişimi denetlemek ve özellik tablosu, modeli veya işlevinin kökenini görüntülemek için Unity Kataloğu'nu kullanın.

Tutorials

Tutorial Description
Başlamak için örnek not defterleri Temel not defteri. Özellik tablosu oluşturmayı, modeli eğitmek için kullanmayı ve otomatik özellik aramasını kullanarak toplu puanlama çalıştırmayı gösterir. Ayrıca özellik aramak ve kökeni görüntülemek için Özellik Mühendisliği kullanıcı arabirimini gösterir.
Taksi örneği not defteri. Model eğitimi ve toplu çıkarım için özellik oluşturma, güncelleştirme ve kullanma sürecini gösterir.
Örnek: Uç nokta sunan bir özelliği dağıtma ve sorgulama Uç nokta sunan bir özelliği dağıtma ve sorgulamayı gösteren öğretici ve örnek not defteri.
Örnek: Yapılandırılmış RAG uygulamalarıyla özellikleri kullanma Databricks çevrimiçi tabloları ve özellik sunma uç noktalarının nasıl kullanılacağını gösteren, elden geçirilmiş üretim (RAG) uygulamaları için öğretici.

Gereksinimler

Databricks Özellik Deposu'nu kullanmak için çalışma alanınızın Unity Kataloğu için etkinleştirilmesi gerekir. Çalışma alanınız Unity Kataloğu için etkinleştirilmemişse bkz . Çalışma Alanı Özellik Deposu (kullanım dışı).

Desteklenen veri türleri

Databricks Özellik Deposu ve eski Çalışma Alanı Özellik Deposu aşağıdaki PySpark veri türlerini destekler:

  • IntegerType
  • FloatType
  • BooleanType
  • StringType
  • DoubleType
  • LongType
  • TimestampType
  • DateType
  • ShortType
  • ArrayType
  • BinaryType [1]
  • DecimalType [1]
  • MapType [1]
  • StructType [2]

[1] BinaryType, DecimalTypeve MapType , Unity Kataloğu'nda ve Çalışma Alanı Özellik Deposu v0.3.5 veya üzeri sürümlerde Özellik Mühendisliği'nin tüm sürümlerinde desteklenir. [2] StructType Özellik Mühendisliği v0.6.0 veya üzerinde desteklenir.

Yukarıda listelenen veri türleri, makine öğrenmesi uygulamalarında yaygın olan özellik türlerini destekler. Örneğin:

  • Yoğun vektörleri, tensörleri ve eklemeleri olarak ArrayTypedepolayabilirsiniz.
  • Seyrek vektörleri, tensorları ve eklemeleri olarak MapTypedepolayabilirsiniz.
  • Metni olarak StringTypedepolayabilirsiniz.

Çevrimiçi mağazalarda ArrayType yayımlandığında ve MapType özellikler JSON biçiminde depolanır.

Özellik Deposu kullanıcı arabirimi, özellik veri türlerinde meta verileri görüntüler:

Karmaşık veri türleri örneği

Daha Fazla Bilgi

En iyi yöntemler hakkında daha fazla bilgi için Özellik Mağazalarının Kapsamlı Kılavuzu'nu indirin.