Zielbasierte Skalierung

Artikel
05/05/2024

Die zielbasierte Skalierung bietet ein schnelles und intuitives Skalierungsmodell für Kunden und wird derzeit für die folgenden Bindungserweiterungen unterstützt:

Apache Kafka
Azure Cosmos DB
Azure Event Hubs
Azure Queue Storage
Azure Service Bus (Warteschlangen und Themen)

Zielbasierte Skalierung ersetzt das vorherige inkrementelle Skalierungsmodell von Azure Functions als Standard für diese Erweiterungstypen. Inkrementelle Skalierung hat maximal einen Worker bei jeder neuen Instanzrate mit komplexen Entscheidungen bezüglich der Skalierung hinzugefügt oder entfernt. Im Gegensatz dazu ermöglicht zielbasierte Skalierung das gleichzeitige Hochskalieren von vier Instanzen, und die Skalierungsentscheidung basiert auf einer einfachen zielbasierten Gleichung:

Abbildung der Gleichung: gewünschte Instanzen = Länge der Ereignisquelle / Zielausführungen pro Instanz.

In dieser Gleichung bezieht sich die Ereignisquellenlänge auf die Anzahl der Ereignisse, die verarbeitet werden müssen. Die Standardwerte für Zielausführungen pro Instanz stammen aus den SDKs, die von den Azure Functions-Erweiterungen verwendet werden. Sie müssen keine Änderungen vornehmen, damit zielbasierte Skalierung funktioniert.

Überlegungen

Berücksichtigen Sie Folgendes, wenn Sie zielbasierte Skalierung verwenden:

Die zielbasierte Skalierung ist standardmäßig für Funktions-Apps im Verbrauchstarif, im Flex-Verbrauchstarif und in Elastic Premium-Tarifen aktiviert. Die ereignisgesteuerte Skalierung wird nicht unterstützt, wenn sie auf dedizierten Tarifen (App Service) ausgeführt wird.
Die zielbasierte Skalierung ist standardmäßig ab Version 4.19.0 der Functions-Laufzeit aktiviert.
Wenn Sie die zielbasierte Skalierung verwenden, werden Skalierungsgrenzwerte weiterhin berücksichtigt. Weitere Informationen finden Sie unter Begrenzen des horizontalen Hochskalierens.
Um eine möglichst genaue Skalierung basierend auf Metriken zu erzielen, verwenden Sie nur eine zielbasierte ausgelöste Funktion pro Funktions-App. Sie sollten auch die Ausführung in einem Flex-Verbrauchstarif in Betracht ziehen, der eine Skalierung pro Funktion bietet.
Wenn mehrere Funktionen in derselben Funktions-App gleichzeitig eine horizontale Skalierung anfordern, wird eine Summe für diese Funktionen verwendet, um die Änderung in den gewünschten Instanzen zu bestimmen. Funktionen, die das Aufskalieren anfordern, setzen Funktionen außer Kraft, die das Abskalieren anfordern.
Wenn keine Anforderung zum horizontalen Herunterskalieren vorhanden ist, Anforderungen jedoch horizontal skaliert werden, wird der Wert für das maximale Herunterskalieren verwendet.

Deaktivieren

Die zielbasierte Skalierung ist standardmäßig für Funktions-Apps aktiviert, die in einem Verbrauchsplan oder in Premium-Plänen gehostet werden. Um zielbasierte Skalierung zu deaktivieren und erneut inkrementelle Skalierung zu verwenden, fügen Sie der Funktions-App die folgende App-Einstellung hinzu:

App-Einstellung	Wert
`TARGET_BASED_SCALING_ENABLED`	0

Anpassen von zielbasierter Skalierung

Sie können das Skalierungsverhalten basierend auf der Workload Ihrer App mehr oder weniger aggressiv gestalten, indem Sie die Zielausführungen pro Instanz anpassen. Jede Erweiterung verfügt über unterschiedliche Einstellungen, mit denen Sie die Zielausführungen pro Instanz festlegen können.

In dieser Tabelle werden die host.json-Werte zusammengefasst, die für die Zielausführungen pro Instanz und verwendet werden, sowie die Standardwerte:

Durchwahl	host.json-Werte	Standardwert
Event Hubs (Erweiterung v5.x oder höher)	extensions.eventHubs.maxEventBatchSize	100^*
Event Hubs (Erweiterung v3.x oder höher)	extensions.eventHubs.eventProcessorOptions.maxBatchSize	10
Event Hubs (sofern definiert)	extensions.eventHubs.targetUnprocessedEventThreshold	–
Service Bus (Erweiterung v5.x oder höher, Single Dispatch)	extensions.serviceBus.maxConcurrentCalls	16
Service Bus (Erweiterung v5.x oder höher, sitzungsbasiert)	extensions.serviceBus.maxConcurrentSessions	8
Service Bus (Erweiterung v5.x oder höher, Batchverarbeitung)	extensions.serviceBus.maxMessageBatchSize	1000
Service Bus (Functions v2.x oder höher, Single Dispatch)	extensions.serviceBus.messageHandlerOptions.maxConcurrentCalls	16
Service Bus (Functions v2.x oder höher, Single Dispatch, sitzungsbasiert)	extensions.serviceBus.sessionHandlerOptions.maxConcurrentSessions	2000
Service Bus (Functions v2.x oder höher, Batchverarbeitung)	extensions.serviceBus.batchOptions.maxMessageCount	1.000
Speicherwarteschlange	extensions.queues.batchSize	16

^* Der Standardwert maxEventBatchSize wurde in Version 6.0.0 des Pakets Microsoft.Azure.WebJobs.Extensions.EventHubs geändert. In früheren Versionen war dieser Wert 10.

Bei einigen Bindungserweiterungen wird die Zielausführung pro Instanz mithilfe eines Funktionsattributes festgelegt:

Erweiterung	Funktionstriggereinstellung	Standardwert
Apache Kafka	`lagThreshold`	1.000
Azure Cosmos DB	`maxItemsPerInvocation`	100

Weitere Informationen finden Sie in den Beispielkonfigurationen für die unterstützten Erweiterungen.

Premium-Plan mit aktivierter Überwachung von Laufzeitskalierung

Wenn die Überwachung der Laufzeitskalierung aktiviert ist, verarbeiten die Erweiterungen selbst die dynamische Skalierung. Dies liegt daran, dass der Skalierungscontroller keinen Zugriff auf Dienste hat, die durch ein virtuelles Netzwerk geschützt sind. Nachdem Sie die Überwachung der Laufzeitskalierung aktiviert haben, müssen Sie Ihre Erweiterungspakete auf diese Mindestversionen aktualisieren, um die zusätzliche zielbasierte Skalierungsfunktionalität zu entsperren:

Name der Erweiterung	Erforderliche Mindestversion
Apache Kafka	3.9.0
Azure Cosmos DB	4.1.0
Event Hubs	5.2.0
Service Bus	5.9.0
Speicherwarteschlange	5.1.0

Unterstützung für dynamische Parallelität

Zielbasierte Skalierung führt zu einer schnelleren Skalierung und verwendet Standardwerte für Zielausführungen pro Instanz. Wenn Sie Service Bus, Storage-Warteschlangen oder Kafka verwenden, können Sie auch dynamische Parallelität aktivieren. In dieser Konfiguration wird der Wert für Zielausführungen pro Instanz automatisch durch das Feature für dynamische Parallelität bestimmt. Begonnen wird mit eingeschränkter Parallelität, dann wird im Laufe der Zeit die beste Einstellung identifiziert.

Unterstützte Erweiterungen

Wie Sie zielbasierte Skalierung in der Datei „host.json“ konfigurieren, hängt vom jeweiligen Erweiterungstyp ab. Dieser Abschnitt enthält die Konfigurationsdetails für die Erweiterungen, die derzeit zielbasierte Skalierung unterstützen.

Service Bus-Warteschlangen und -Themen

Die Service Bus-Erweiterung unterstützt drei Ausführungsmodelle, die durch die IsBatched- und IsSessionsEnabled-Attribute ihres Service Bus-Triggers bestimmt werden. Der Standardwert für IsBatched und IsSessionsEnabled ist false.

Ausführungsmodell	IsBatched	IsSessionsEnabled	Für Zielausführungen pro Instanz verwendete Einstellung
Single Dispatch-Verarbeitung	false	false	maxConcurrentCalls
Single Dispatch-Verarbeitung (sitzungsbasiert)	false	true	maxConcurrentSessions
Batchverarbeitung	true	false	maxMessageBatchSize or maxMessageCount

Hinweis

Skalierungseffizienz: Verwenden Sie für die Service Bus-Erweiterung Verwaltungsrechte für Ressourcen, um eine möglichst effiziente Skalierung zu erreichen. Mit Lauschrechten wird die Skalierung auf inkrementelle Skalierung zurückgesetzt, weil die Länge der Warteschlange oder des Themas nicht in Skalierungsentscheidungen einbezogen werden kann. Weitere Informationen zum Festlegen von Berechtigungen in Service Bus-Zugriffsrichtlinien finden Sie unter SAS-Autorisierungsrichtlinien.

Single Dispatch-Verarbeitung

In diesem Modell verarbeitet jeder Aufruf Ihrer Funktion eine einzelne Nachricht. Die maxConcurrentCalls-Einstellung steuert die Zielausführungen pro Instanz. Die spezifische Einstellung hängt von der Version der Service Bus-Erweiterung ab.

v5.x oder höher
Ab v2.x

Ändern Sie die host.json-Einstellung maxConcurrentCalls wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "serviceBus": {
            "maxConcurrentCalls": 16
        }
    }
}

Ändern Sie die host.json-Einstellung maxConcurrentCalls in messageHandlerOptions, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "serviceBus": {
            "messageHandlerOptions": {
                "maxConcurrentCalls": 16
            }
        }
    }
}

Single Dispatch-Verarbeitung (sitzungsbasiert)

In diesem Modell verarbeitet jeder Aufruf Ihrer Funktion eine einzelne Nachricht. Abhängig von der Anzahl der aktiven Sitzungen für Ihr Service Bus-Thema bzw. Ihre -Warteschlange least jede Instanz jedoch mindestens eine Sitzung. Die spezifische Einstellung hängt von der Version der Service Bus-Erweiterung ab.

v5.x oder höher
v2.x+

Ändern Sie die host.json-Einstellung maxConcurrentSessions, um Zielausführungen pro Instanz festzulegen, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "serviceBus": {
            "maxConcurrentSessions": 8
        }
    }
}

Ändern Sie die host.json-Einstellung maxConcurrentSessions in sessionHandlerOptions, um Zielausführungen pro Instanz festzulegen, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "serviceBus": {
            "sessionHandlerOptions": {
                "maxConcurrentSessions": 2000
            }
        }
    }
}

Batchverarbeitung

In diesem Modell verarbeitet jeder Aufruf Ihrer Funktion einen Batch von Nachrichten. Die spezifische Einstellung hängt von der Version der Service Bus-Erweiterung ab.

v5.x oder höher
v2.x+

Ändern Sie die host.json-Einstellung maxMessageBatchSize, um Zielausführungen pro Instanz festzulegen, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "serviceBus": {
            "maxMessageBatchSize": 1000
        }
    }
}

Ändern Sie die host.json-Einstellung maxMessageCount in batchOptions, um Zielausführungen pro Instanz festzulegen, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "serviceBus": {
            "batchOptions": {
                "maxMessageCount": 1000
            }
        }
    }
}

Event Hubs

Für Azure Event Hubs wird Azure Functions basierend auf der Anzahl der nicht verarbeiteten Ereignisse skaliert, die auf alle Partitionen im Event Hub verteilt sind. Standardmäßig sind die für Zielausführungen pro Instanz verwendeten host.json-Attribute maxEventBatchSize und maxBatchSize. Wenn Sie sich jedoch dafür entscheiden, zielbasierte Skalierung zu optimieren, können Sie einen separaten Parameter targetUnprocessedEventThreshold definieren, der ein Überschreibung vornimmt, um Zielausführungen pro Instanz festzulegen, ohne die Batcheinstellungen zu ändern. Wenn targetUnprocessedEventThreshold festgelegt ist, wird die Gesamtzahl der unverarbeiteten Ereignisse durch diesen Wert geteilt, um die Anzahl der Instanzen zu bestimmen, die auf eine Anzahl von Workerinstanzen aufgerundet wird, die eine ausgewogene Partitionsverteilung ergibt.

Hinweis

Da es sich bei Event Hubs um eine partitionierte Workload handelt, wird die Anzahl der Zielinstanzen für Event Hubs durch die Anzahl der Partitionen in Ihrem Event Hub begrenzt.

Die spezifische Einstellung hängt von der Version der Event Hubs-Erweiterung ab.

v5.x oder höher
v3.x oder höher

Ändern Sie die host.json-Einstellung maxEventBatchSize, um Zielausführungen pro Instanz festzulegen, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "eventHubs": {
            "maxEventBatchSize" : 100
        }
    }
}

Wenn in host.json definiert, wird targetUnprocessedEventThreshold als Zielausführungen pro Instanz anstelle von maxEventBatchSize verwendet, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "eventHubs": {
            "targetUnprocessedEventThreshold": 153
        }
    }
}

Ändern Sie für v3.x oder höher der Event Hubs-Erweiterung die host.json-Einstellung maxBatchSize unter eventProcessorOptions, um Zielausführungen pro Instanz festzulegen:

{
    "version": "2.0",
    "extensions": {
        "eventHubs": {
            "eventProcessorOptions": {
                "maxBatchSize": 10
            }
        }
    }
}

Wenn in host.json definiert, wird targetUnprocessedEventThreshold als Zielausführungen pro Instanz anstelle von maxBatchSize verwendet, wie im folgenden Beispiel gezeigt:

{
    "version": "2.0",
    "extensions": {
        "eventHubs": {
            "targetUnprocessedEventThreshold": 23
        }
    }
}

Storage-Warteschlangen

Ändern Sie für v2.x oder höher der Speichererweiterung die host.json-Einstellung batchSize, um Zielausführungen pro Instanz festzulegen:

{
    "version": "2.0",
    "extensions": {
        "queues": {
            "batchSize": 16
        }
    }
}

Hinweis

Skalierungseffizienz: Für die Speicherwarteschlangenerweiterung werden Nachrichten mit visibilityTimeout weiterhin von den Speicherwarteschlangen-APIs in der Länge der Ereignisquelle gezählt. Dies kann zu einer Überskalierung Ihrer Funktions-App führen. Erwägen Sie die Verwendung von Service Bus-Warteschlangen mit geplanten Nachrichten, das Einschränken der horizontalen Skalierung oder die Verwendung von visibilityTimeout für Ihre Lösung.

Azure Cosmos DB

Azure Cosmos DB verwendet ein Attribut auf Funktionsebene: MaxItemsPerInvocation. Wie Sie dieses Attribut auf Funktionsebene festlegen, hängt von Ihrer Funktionssprache ab.

Legen Sie für eine kompilierte C#-Funktion in Ihrer Triggerdefinition MaxItemsPerInvocation fest, wie in den folgenden Beispielen für eine prozessinterne C#-Funktion gezeigt:

namespace CosmosDBSamplesV2
{
    public static class CosmosTrigger
    {
        [FunctionName("CosmosTrigger")]
        public static void Run([CosmosDBTrigger(
            databaseName: "ToDoItems",
            collectionName: "Items",
            MaxItemsPerInvocation: 100,
            ConnectionStringSetting = "CosmosDBConnection",
            LeaseCollectionName = "leases",
            CreateLeaseCollectionIfNotExists = true)]IReadOnlyList<Document> documents,
            ILogger log)
        {
            if (documents != null && documents.Count > 0)
            {
                log.LogInformation($"Documents modified: {documents.Count}");
                log.LogInformation($"First document Id: {documents[0].Id}");
            }
        }
    }
}

Für Functions-Sprachen, die function.json verwenden, wird der MaxItemsPerInvocation-Parameter in der spezifischen Bindung definiert, wie in diesem Beispiel für einen Azure Cosmos DB-Trigger gezeigt:

{
    "scriptFile": "main.py",
    "bindings": [
        {
          "type": "cosmosDBTrigger",
          "maxItemsPerInvocation": 100,
          "connection": "MyCosmosDb",
          "leaseContainerName": "leases",
          "containerName": "collectionName",
          "databaseName": "databaseName",
          "leaseDatabaseName": "databaseName",
          "createLeaseContainerIfNotExists": false,
          "startFromBeginning": false,
          "name": "input"
        }
    ]
}

Beispiele für das Programmiermodell von Python 2 sind noch nicht verfügbar.

{
  "bindings": [
    {
      "type": "cosmosDBTrigger",
      "maxItemsPerInvocation": 100,
      "connection": "MyCosmosDb",
      "leaseContainerName": "leases",
      "containerName": "collectionName",
      "databaseName": "databaseName",
      "leaseDatabaseName": "databaseName",
      "createLeaseContainerIfNotExists": false,
      "startFromBeginning": false,
      "name": "input"
    }
  ]
}

Beispiele für das Programmiermodell von Node.js 4 sind noch nicht verfügbar.

Hinweis

Da es sich bei Azure Cosmos DB um eine partitionierte Workload handelt, wird die Anzahl der Zielinstanzen für die Datenbank durch die Anzahl der physischen Partitionen in Ihrem Container begrenzt. Weitere Informationen zur Skalierung von Azure Cosmos DB finden Sie unter physische Partitionen und Leasebesitz.

Apache Kafka

Die Apache Kafka-Erweiterung verwendet ein Attribut auf Funktionsebene: LagThreshold. Bei Kafka wird die Anzahl der gewünschten Instanzen basierend auf der Gesamtverzögerung der Consumer dividiert durch die LagThreshold-Einstellung berechnet. Bei einer bestimmten Verzögerung erhöht die Verringerung der Verzögerungsschwelle die Anzahl der gewünschten Instanzen.

Wie Sie dieses Attribut auf Funktionsebene festlegen, hängt von Ihrer Funktionssprache ab. In diesem Beispiel wird der Schwellenwert auf 100 festgelegt.

Legen Sie für eine kompilierte C#-Funktion in Ihrer Triggerdefinition LagThreshold fest, wie in den folgenden Beispielen für eine prozessinterne C#-Funktion für einen Kafka-Event Hubs-Trigger gezeigt:

[FunctionName("KafkaTrigger")]
public static void Run(
    [KafkaTrigger("BrokerList",
                  "topic",
                  Username = "$ConnectionString",
                  Password = "%EventHubConnectionString%",
                  Protocol = BrokerProtocol.SaslSsl,
                  AuthenticationMode = BrokerAuthenticationMode.Plain,
                  ConsumerGroup = "$Default",
                  LagThreshold = 100)] KafkaEventData<string> kevent, ILogger log)
{            
    log.LogInformation($"C# Kafka trigger function processed a message: {kevent.Value}");
}

public class KafkaTriggerMany {
    @FunctionName("KafkaTriggerMany")
    public void runMany(
            @KafkaTrigger(
                name = "kafkaTriggerMany",
                topic = "topic",  
                brokerList="%BrokerList%",
                consumerGroup="$Default", 
                username = "$ConnectionString", 
                password = "EventHubConnectionString",
                authenticationMode = BrokerAuthenticationMode.PLAIN,
                protocol = BrokerProtocol.SASLSSL,
                LagThreshold = 100,
                // sslCaLocation = "confluent_cloud_cacert.pem", // Enable this line for windows.
                cardinality = Cardinality.MANY,
                dataType = "string"
             ) String[] kafkaEvents,
            final ExecutionContext context) {
            for (String kevent: kafkaEvents) {
                context.getLogger().info(kevent);
            }

Für Functions-Sprachen, die function.json verwenden, wird der LagThreshold-Parameter in der spezifischen Bindung definiert, wie in diesem Beispiel für einen Kafka-Event Hubs-Trigger gezeigt:

{
      "scriptFile": "main.py",
      "bindings": [
        {
          "type": "kafkaTrigger",
          "name": "kevent",
          "topic": "topic",
          "brokerList": "%BrokerList%",
          "username": "$ConnectionString",
          "password": "EventHubConnectionString",
          "consumerGroup" : "functions",
          "protocol": "saslSsl",
          "authenticationMode": "plain",
          "lagThreshold": "100"
        }
    ]
}

Das Programmiermodell von Python 2 wird derzeit nicht von der Kafka-Erweiterung unterstützt.

Für Functions-Sprachen, die function.json verwenden, wird der LagThreshold-Parameter in der spezifischen Bindung definiert, wie in diesem Beispiel für einen Kafka-Event Hubs-Trigger gezeigt:

{
    "bindings": [
      {
            "type": "kafkaTrigger",
            "name": "kafkaEvent",
            "direction": "in",
            "protocol" : "SASLSSL",
            "password" : "EventHubConnectionString",
            "dataType" : "string",
            "topic" : "topic",
            "authenticationMode" : "PLAIN",
            "consumerGroup" : "$Default",
            "username" : "$ConnectionString",
            "brokerList" : "%BrokerList%",
            "sslCaLocation": "confluent_cloud_cacert.pem",
            "lagThreshold": "100"
        }
    ]
}

Das Programmiermodell von Node.js 4 wird derzeit nicht von der Kafka-Erweiterung unterstützt.

Nächste Schritte

Weitere Informationen erhalten Sie in den folgenden Artikeln:

Teilen über

Zielbasierte Skalierung

Überlegungen

Deaktivieren

Anpassen von zielbasierter Skalierung

Premium-Plan mit aktivierter Überwachung von Laufzeitskalierung

Unterstützung für dynamische Parallelität

Unterstützte Erweiterungen

Service Bus-Warteschlangen und -Themen

Single Dispatch-Verarbeitung

Single Dispatch-Verarbeitung (sitzungsbasiert)

Batchverarbeitung

Event Hubs

Storage-Warteschlangen

Azure Cosmos DB

Apache Kafka

Nächste Schritte

Feedback

Zusätzliche Ressourcen