Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Ez a cikk azt ismerteti, hogyan engedélyezheti az útvonaloptimalizálást a modell kiszolgáló vagy a funkciókiszolgáló végpontjain. Az útvonaloptimalizált kiszolgáló végpontok jelentősen csökkentik a többletterhelés késését, és lehetővé teszik a végpont által támogatott átviteli sebesség jelentős javulását.
Az útvonaloptimalizált végpontok lekérdezése eltér a nem útvonaloptimalizált végpontoktól, beleértve egy másik URL-címet és hitelesítést OAuth-jogkivonatokkal. Részletekért tekintse meg a lekérdezés útvonaloptimalizált kiszolgálóvégpontjait .
Mi az útvonaloptimalizálás?
Amikor engedélyezi az útvonaloptimalizálást egy végponton, a Databricks Modellszolgáltatás javítja a következtetési kérelmek hálózati elérési útját, ami gyorsabb, közvetlenebb kommunikációt eredményez az ügyfél és a modell között. Ez az optimalizált útválasztás nagyobb lekérdezéseket old fel másodpercenként a nem optimalizált végpontokhoz képest, és stabilabb és alacsonyabb késést biztosít az alkalmazások számára.
Jótanács
Az útvonaloptimalizálás a gyártási munkaterhelések optimalizálására szolgáló számos stratégia egyike. Az optimalizálási technikák átfogó útmutatója: A modellkiszolgáló végpontok optimalizálása éles környezetben.
Követelmények
- Az útvonaloptimalizálás a modellvégpontokon ugyanazokra a követelményekre vonatkozik, mint a nem útvonaloptimalizált, végpontokat kiszolgáló modellre.
- A szolgáltatáskiszolgáló végpontok útvonal-optimalizálása ugyanazokat a követelményeket támasztja, mint a nem útvonaloptimalizált, végpontokat kiszolgáló funkciók.
Útvonaloptimalizálás engedélyezése egy végpontot kiszolgáló modellen
Felhasználói felület kiszolgálása
Az útvonaloptimalizálást akkor engedélyezheti, ha egy kiszolgálói végpontot kiszolgáló modellt hoz létre a kiszolgáló felhasználói felülettel. Csak a végpont létrehozásakor engedélyezheti az útvonaloptimalizálást, a meglévő végpontokat nem frissítheti útvonaloptimalizáltra.
- Az oldalsávon kattintson a Kiszolgáló gombra a Kiszolgáló felhasználói felület megjelenítéséhez.
- Kattintson a Kiszolgálóvégpont létrehozása elemre.
- Az Útvonaloptimalizálás szakaszban válassza az Útvonaloptimalizálás engedélyezése lehetőséget.
- A végpont létrehozása után a Databricks értesítést küld arról, hogy mi szükséges az útvonaloptimalizált végpont lekérdezéséhez.
REST API
Ha a kiszolgáló végpontot a REST API használatával szeretné beállítani az útvonaloptimalizáláshoz, adja meg a paramétert a route_optimized végpontlétrehozási modell létrehozása során. Ezt a paramétert csak a végpont létrehozásakor adhatja meg, a meglévő végpontokat nem frissítheti útvonaloptimalizáltra.
POST /api/2.0/serving-endpoints
{
"name": "my-endpoint",
"config":
{
"served_entities":
[{
"entity_name": "ads1",
"entity_version": "1",
"workload_type": "CPU",
"workload_size": "Small",
"scale_to_zero_enabled": true,
}],
},
"route_optimized": true
}
Python
Ha Pythont használ, az alábbi jegyzetfüzet használatával létrehozhat egy útvonaloptimalizált kiszolgálóvégpontot.
Útvonaloptimalizált kiszolgálóvégpont létrehozása Python-jegyzetfüzet használatával
Databricks SDK
Ha a kiszolgálóvégpontot a Databricks SDK használatával szeretné beállítani az útvonaloptimalizáláshoz, adja meg a paramétert a route_optimized végpontlétrehozást kiszolgáló modell során. Ezt a paramétert csak a végpont létrehozásakor adhatja meg, a meglévő végpontokat nem frissítheti útvonaloptimalizáltra.
from databricks.sdk import WorkspaceClient
from databricks.sdk.service.serving import EndpointCoreConfigInput, ServedEntityInput
workspace = WorkspaceClient()
workspace.serving_endpoints.create(
name="my-serving-endpoint",
config = EndpointCoreConfigInput(
served_entities=[
ServedEntityInput(
entity_name="main.default.my-served-entity",
scale_to_zero_enabled=True,
workload_size="Small"
)
]
),
route_optimized=True
)
Útvonaloptimalizálás engedélyezése egy szolgáltatásvégponton
Az útvonaloptimalizálás funkció- és függvény-kiszolgáláshoz való használatához adja meg a szolgáltatás specifikációjának teljes nevét a entity_name végpontlétrehozási kérelmek kiszolgálására szolgáló mezőben. Ehhez entity_version nincs szükség FeatureSpecs.
POST /api/2.0/serving-endpoints
{
"name": "my-endpoint",
"config":
{
"served_entities":
[
{
"entity_name": "catalog_name.schema_name.feature_spec_name",
"workload_type": "CPU",
"workload_size": "Small",
"scale_to_zero_enabled": true
}
]
},
"route_optimized": true
}
Korlátozások
- Az útvonaloptimalizálás csak a végpontokat kiszolgáló egyéni modellhez és a szolgáltatásvégpontok kiszolgálásához érhető el. Az Alapmodell API-kat vagy külső modelleket használó végpontok kiszolgálása nem támogatott.
- A databricks házon belüli OAuth-jogkivonatok az útvonaloptimalizálás egyetlen támogatott hitelesítése. A személyes hozzáférési jogkivonatok nem támogatottak.