Freigeben über


Grundlegendes zu Entitäten auf oberster Ebene im verwalteten Feature Store

In diesem Dokument werden die Entitäten auf oberster Ebene im verwalteten Feature Store beschrieben.

Diagram depicting the main components of managed feature store.

Weitere Informationen zum verwalteten Feature Store finden Sie unter Was ist der verwaltete Feature Store?

Featurespeicher

Sie können Featuresätze mithilfe eines Feature Stores erstellen und verwalten. Ein Featuresatz ist eine Sammlung von Features. Sie können optional einen Materialisierungsspeicher (Offline-Speicherverbindung) mit einem Feature-Speicher verknüpfen, um die Features regelmäßig vorzuberechnen und zu persistieren. Sie kann die Merkmalsabfrage während des Trainings oder der Inferenz schneller und zuverlässiger machen.

Weitere Informationen zur Konfiguration finden Sie unter CLI (v2) Feature Store YAML Schema

Entitäten

Die Indexspalten für logische Entitäten in einem Unternehmen sind in Entitäten gekapselt. Beispiele für Entitäten sind Kontoentität, Kundenentität usw. Entitäten helfen dabei, die Verwendung der gleichen Indexspaltendefinitionen in den Feature-Sets, die die gleichen logischen Entitäten verwenden, als Best Practice durchzusetzen.

Entitäten werden in der Regel einmal erstellt und dann in verschiedenen Feature-Sets wiederverwendet. Entitäten werden mit einer Versionsangabe versehen.

Weitere Informationen zur Konfiguration finden Sie unter CLI (v2) Feature Entity YAML Schema

Featuresatzspezifikation und -ressource

Merkmalssätze sind eine Sammlung von Merkmalen, die durch Anwendung von Transformationen auf Quellsystemdaten erzeugt werden. Featuresätze kapseln eine Quelle, die Transformationsfunktion und die Materialisierungseinstellungen. Wir unterstützen derzeit PySpark Feature Transformation Code.

Beginnen Sie mit der Erstellung einer Feature-Set-Spezifikation. Eine Featuresatzspezifikation ist eine eigenständige Definition eines Featuresatzes, die Sie lokal entwickeln und testen können.

Eine Featuresatzspezifikation besteht in der Regel aus den folgenden Parametern:

  • source: die Quellen, denen dieses Feature zugeordnet ist
  • transformation (optional): Die Transformationslogik, die auf die Quelldaten angewendet wird, um Merkmale zu erstellen. In unserem Fall verwenden wir Spark als unterstützte Recheneinheit.
  • Namen der Spalten, die die index_columns und die timestamp_column darstellen: Diese Namen werden benötigt, wenn Benutzer versuchen, Merkmalsdaten mit Beobachtungsdaten zu verknüpfen (mehr dazu später)
  • materialization_settings(optional): Erforderlich, um die Merkmalswerte in einem Materialisierungsspeicher für einen effizienten Abruf zwischenzuspeichern.

Nach der Entwicklung und dem Testen der Feature-Set-Spezifikation in Ihrer lokalen/Entwicklungsumgebung können Sie die Spezifikation als Feature-Set-Asset im Feature Store registrieren. Das Feature-Set-Asset bietet verwaltete Funktionen, wie Versionierung und Materialisierung.

Weitere Informationen zur Feature-Set YAML-Spezifikation finden Sie unter CLI (v2) Feature-Set-Spezifikation YAML-Schema

Featureabrufspezifikation

Eine Spezifikation zum Abrufen von Merkmalen ist eine übertragbare Definition einer mit einem Modell verbundenen Merkmalsliste. Sie kann dazu beitragen, die Entwicklung und Operationalisierung von Modellen für maschinelles Lernen zu rationalisieren. Eine Spezifikation für das Abrufen von Merkmalen ist in der Regel ein Input für die Trainingspipeline. Sie hilft bei der Erstellung der Trainingsdaten. Sie kann zusammen mit dem Modell verpackt werden. Darüber hinaus wird sie im Schritt der Inferenz verwendet, um die Merkmale zu suchen. Es integriert alle Phasen des Lebenszyklus des maschinellen Lernens. Änderungen an Ihrer Trainings- und Rückschlusspipeline können beim Experimentieren und Bereitstellen minimiert werden.

Die Verwendung einer Spezifikation für die Merkmalsabfrage und der eingebauten Komponente für die Merkmalsabfrage ist optional. Sie können direkt die get_offline_features() API verwenden, wenn Sie möchten.

Weitere Informationen zur Feature Retrieval YAML Spezifikation finden Sie unter CLI (v2) Feature Retrieval Spezifikation YAML Schema.

Nächste Schritte