Megosztás a következőn keresztül:


A kezelt funkciótár legfelső szintű entitásainak ismertetése

Ez a dokumentum a kezelt funkciótár legfelső szintű entitását ismerteti.

A kezelt funkciótár fő összetevőit ábrázoló diagram.

További információ a kezelt funkciótár: Mi a kezelt funkciótár?

Funkciótár

Szolgáltatáskészleteket egy szolgáltatástárolón keresztül hozhat létre és kezelhet. A funkciókészletek funkciók gyűjteményei. A funkciók rendszeres előkomponálásához és megőrzéséhez szükség esetén társíthat materializációs tárolót (offline áruházi kapcsolatot) egy szolgáltatástárolóhoz. A betanítás vagy következtetés során a funkciók lekérése gyorsabb és megbízhatóbb lehet.

A konfigurációval kapcsolatos további információkért lásd a CLI (v2) szolgáltatástároló YAML-sémáját

Entitások

Az entitások a vállalati logikai entitások indexoszlopait tartalmazzák. Az entitások közé tartoznak például a fiók entitásai, az ügyfél entitásai stb. Az entitások az ajánlott eljárásként segítenek kikényszeríteni ugyanazon indexoszlop-definíciók használatát az ugyanazon logikai entitásokat használó szolgáltatáskészletekben.

Az entitások általában egyszer jönnek létre, majd újra felhasználhatók a funkciókészletek között. Az entitások verziószámozottak.

A konfigurációval kapcsolatos további információkért lásd : CLI (v2) feature entity YAML schema

Funkciókészlet specifikációja és objektuma

A funkciókészletek olyan szolgáltatások gyűjteményei, amelyek átalakítások alkalmazásával jönnek létre a forrásrendszer adatain. A funkciókészletek beágyazzák a forrást, az átalakítási függvényt és a materializálási beállításokat. Jelenleg a PySpark funkcióátalakítási kódját támogatjuk.

Először hozzon létre egy szolgáltatáskészlet-specifikációt. A szolgáltatáskészlet-specifikációk a helyileg fejleszthető és tesztelhető funkciókészletek önálló definíciói.

A szolgáltatáskészlet specifikációja általában a következő paraméterekből áll:

  • source: Milyen forrásra van megfeleltetve ez a funkció?
  • transformation (nem kötelező): A forrásadatokra alkalmazott átalakítási logika a szolgáltatások létrehozásához. Esetünkben a Sparkot használjuk támogatott számításként.
  • A következő oszlopokat képviselő index_columns oszlopok nevei: timestamp_columnEzekre a nevekre akkor van szükség, ha a felhasználók megfigyelési adatokkal próbálják összekapcsolni a funkcióadatokat (erről később bővebben olvashat).
  • materialization_settings(nem kötelező): Szükséges a funkcióértékek gyorsítótárazásához egy materializálási tárolóban a hatékony lekérés érdekében.

Miután a helyi/fejlesztői környezetben tesztelte a funkciókészlet specifikációját, regisztrálhatja a specifikációt funkciókészlet-objektumként a funkciótárolóban. A funkciókészlet-objektum felügyelt képességeket biztosít, például verziószámozást és materializálást.

A szolgáltatáskészlet YAML-specifikációjával kapcsolatos további információkért lásd a CLI (v2) szolgáltatáskészlet specifikációját a YAML-sémában

Funkciólekérési specifikáció

A funkciólekérési specifikáció egy modellhez társított funkciólista hordozható definíciója. Segítségével egyszerűbbé teheti a gépi tanulási modellek fejlesztését és üzembe helyezését. A funkciólekérési specifikáció általában a betanítási folyamat bemenete. Segít létrehozni a betanítási adatokat. A modellel együtt csomagolható. A következtetési lépés emellett a funkciók keresésére is szolgál. A gépi tanulási életciklus minden fázisát integrálja. A betanítási és következtetési folyamat módosításai a kísérletezés és üzembe helyezés során minimálisra csökkenthetők.

A funkciólekérési specifikáció és a beépített funkciólekérési összetevő használata nem kötelező. Igény szerint közvetlenül is használhatja az get_offline_features() API-t.

A szolgáltatáslekérési YAML-specifikációval kapcsolatos további információkért lásd a CLI (v2) szolgáltatáslekérési specifikációjának YAML-sémáját.

Következő lépések