A kezelt funkciótár legfelső szintű entitásainak ismertetése
Ez a dokumentum a kezelt funkciótár legfelső szintű entitását ismerteti.
További információ a kezelt funkciótár: Mi a kezelt funkciótár?
Funkciótár
Szolgáltatáskészleteket egy szolgáltatástárolón keresztül hozhat létre és kezelhet. A funkciókészletek funkciók gyűjteményei. A funkciók rendszeres előkomponálásához és megőrzéséhez szükség esetén társíthat materializációs tárolót (offline áruházi kapcsolatot) egy szolgáltatástárolóhoz. A betanítás vagy következtetés során a funkciók lekérése gyorsabb és megbízhatóbb lehet.
A konfigurációval kapcsolatos további információkért lásd a CLI (v2) szolgáltatástároló YAML-sémáját
Entitások
Az entitások a vállalati logikai entitások indexoszlopait tartalmazzák. Az entitások közé tartoznak például a fiók entitásai, az ügyfél entitásai stb. Az entitások az ajánlott eljárásként segítenek kikényszeríteni ugyanazon indexoszlop-definíciók használatát az ugyanazon logikai entitásokat használó szolgáltatáskészletekben.
Az entitások általában egyszer jönnek létre, majd újra felhasználhatók a funkciókészletek között. Az entitások verziószámozottak.
A konfigurációval kapcsolatos további információkért lásd : CLI (v2) feature entity YAML schema
Funkciókészlet specifikációja és objektuma
A funkciókészletek olyan szolgáltatások gyűjteményei, amelyek átalakítások alkalmazásával jönnek létre a forrásrendszer adatain. A funkciókészletek beágyazzák a forrást, az átalakítási függvényt és a materializálási beállításokat. Jelenleg a PySpark funkcióátalakítási kódját támogatjuk.
Először hozzon létre egy szolgáltatáskészlet-specifikációt. A szolgáltatáskészlet-specifikációk a helyileg fejleszthető és tesztelhető funkciókészletek önálló definíciói.
A szolgáltatáskészlet specifikációja általában a következő paraméterekből áll:
source
: Milyen forrásra van megfeleltetve ez a funkció?transformation
(nem kötelező): A forrásadatokra alkalmazott átalakítási logika a szolgáltatások létrehozásához. Esetünkben a Sparkot használjuk támogatott számításként.- A következő oszlopokat képviselő
index_columns
oszlopok nevei:timestamp_column
Ezekre a nevekre akkor van szükség, ha a felhasználók megfigyelési adatokkal próbálják összekapcsolni a funkcióadatokat (erről később bővebben olvashat). materialization_settings
(nem kötelező): Szükséges a funkcióértékek gyorsítótárazásához egy materializálási tárolóban a hatékony lekérés érdekében.
Miután a helyi/fejlesztői környezetben tesztelte a funkciókészlet specifikációját, regisztrálhatja a specifikációt funkciókészlet-objektumként a funkciótárolóban. A funkciókészlet-objektum felügyelt képességeket biztosít, például verziószámozást és materializálást.
A szolgáltatáskészlet YAML-specifikációjával kapcsolatos további információkért lásd a CLI (v2) szolgáltatáskészlet specifikációját a YAML-sémában
Funkciólekérési specifikáció
A funkciólekérési specifikáció egy modellhez társított funkciólista hordozható definíciója. Segítségével egyszerűbbé teheti a gépi tanulási modellek fejlesztését és üzembe helyezését. A funkciólekérési specifikáció általában a betanítási folyamat bemenete. Segít létrehozni a betanítási adatokat. A modellel együtt csomagolható. A következtetési lépés emellett a funkciók keresésére is szolgál. A gépi tanulási életciklus minden fázisát integrálja. A betanítási és következtetési folyamat módosításai a kísérletezés és üzembe helyezés során minimálisra csökkenthetők.
A funkciólekérési specifikáció és a beépített funkciólekérési összetevő használata nem kötelező. Igény szerint közvetlenül is használhatja az get_offline_features()
API-t.
A szolgáltatáslekérési YAML-specifikációval kapcsolatos további információkért lásd a CLI (v2) szolgáltatáslekérési specifikációjának YAML-sémáját.