Serverseitige Leistungsabfragen

Artikel
06/01/2023

Eine gute Renderingleistung auf dem Server ist für stabile Bildfrequenzen und eine hohe Benutzerfreundlichkeit von entscheidender Bedeutung. Es ist wichtig, die Leistungsmerkmale auf dem Server sorgfältig zu überwachen und bei Bedarf zu optimieren. Leistungsdaten können über dedizierte API-Funktionen abgefragt werden.

Die größte Auswirkung auf die Renderingleistung haben die Modelleingabedaten. Sie können die Eingabedaten wie unter Konfigurieren der Modellkonvertierung beschrieben optimieren.

Auch die clientseitige Anwendungsleistung kann einen Engpass darstellen. Es empfiehlt sich, eine Ablaufverfolgung für die Leistung (performance trace) durchzuführen, um die clientseitige Leistung eingehend zu analysieren.

Zeitachse für Client/Server

Bevor wir auf die verschiedenen Latenzwerte eingehen, sollten wir einen Blick auf die Synchronisationspunkte zwischen Client und Server auf der Zeitachse werfen:

Pipeline timeline

Die Abbildung enthält folgende Informationen:

Vom Client wird mit einer konstanten Bildfrequenz von 60 Hz (alle 16,6 ms) eine Stellungsschätzung ausgelöst.
Der Server startet das Rendering anschließend basierend auf dieser Stellung.
Der Server sendet das codierte Videobild zurück.
Der Client decodiert das Bild, führt einige zusätzliche CPU- und GPU-Schritte aus und zeigt das Bild anschließend an.

Abfragen zur Framestatistik

Die Framestatistik enthält allgemeine Informationen zum letzten Frame, z. B. zur Latenz. Da die in der Struktur FrameStatistics bereitgestellten Daten auf der Clientseite gemessen werden, wird für die API ein synchroner Aufruf durchgeführt:

void QueryFrameData(RenderingSession session)
{
    FrameStatistics frameStatistics;
    if (session.GraphicsBinding.GetLastFrameStatistics(out frameStatistics) == Result.Success)
    {
        // do something with the result
    }
}

void QueryFrameData(ApiHandle<RenderingSession> session)
{
    FrameStatistics frameStatistics;
    if (session->GetGraphicsBinding()->GetLastFrameStatistics(&frameStatistics) == Result::Success)
    {
        // do something with the result
    }
}

Das abgerufene Objekt FrameStatistics enthält die folgenden Member:

Member	Erklärung
LatencyPoseToReceive	Die Latenz für die Schätzung der Kamerastellung auf dem Clientgerät, bis für die Clientanwendung ein Serverframe für diese Stellung vollständig verfügbar ist. Dieser Wert umfasst den Netzwerkroundtrip, die Renderzeit des Servers, die Videodecodierung und die Jitterkorrektur. Siehe Intervall 1 in der obigen Abbildung.
LatencyReceiveToPresent	Latenz der Verfügbarkeit eines empfangenen Remote-Frames, bis die Client-App „PresentFrame“ für die CPU aufruft. Siehe Intervall 2 in der obigen Abbildung.
LatencyPresentToDisplay	Latenz der Darstellung eines Frames in der CPU, bis die Anzeige verfügbar ist. Dieser Wert umfasst die GPU-Zeit des Clients, Framepufferung des Betriebssystems, Umprojizierung der Hardware und geräteabhängige Scandauer der Anzeige. Siehe Intervall 3 in der obigen Abbildung.
TimeSinceLastPresent	Die Zeit zwischen nachfolgenden Aufrufen und „PresentFrame“ in der CPU. Höhere Werte als die Anzeigedauer (z. B. 16,6 ms auf einem Clientgerät mit 60 Hz) deuten auf Probleme hin, die deshalb auftreten, weil die Clientanwendung die CPU-Workload nicht rechtzeitig abgearbeitet hat.
VideoFramesReceived	Die Anzahl von Frames, die vom Server innerhalb der letzten Sekunde empfangen wurden.
VideoFrameReusedCount	Anzahl von innerhalb der letzten Sekunde empfangenen Frames, die auf dem Gerät mehr als einmal verwendet wurden. Mit anderen Werten als Null wird angegeben, dass Frames wiederverwendet und umprojiziert werden mussten, weil entweder Netzwerkjitter aufgetreten ist oder der Server sehr viel Zeit für das Rendern benötigt hat.
VideoFramesSkipped	Anzahl von empfangenen Frames innerhalb der letzten Sekunde, die decodiert, aber nicht in der Anzeige dargestellt wurden, weil ein neuer Frame eingetroffen ist. Mit anderen Werten als Null wird angegeben, dass aufgrund von Netzwerkjitter mehrere Frames verzögert waren und dann auf einmal auf dem Clientgerät eingetroffen sind.
VideoFramesDiscarded	Hierfür besteht eine starke Ähnlichkeit mit VideoFramesSkipped. Der Grund für das Verwerfen ist aber, dass ein Frame so spät eingetroffen ist, dass sogar eine Korrelation mit einer ausstehenden Stellung nicht mehr möglich ist. Wenn dies der Fall ist, kommt es zu schweren Netzwerkkonflikten.
VideoFrameMinDelta	Minimale Zeitspanne zwischen zwei aufeinanderfolgenden Frames, die innerhalb der letzten Sekunde eingetroffen sind. Zusammen mit „VideoFrameMaxDelta“ ist dieser Bereich ein Hinweis auf Jitter, der durch das Netzwerk oder den Videocodec verursacht wird.
VideoFrameMaxDelta	Maximale Zeitspanne zwischen zwei aufeinanderfolgenden Frames, die innerhalb der letzten Sekunde eingetroffen sind. Zusammen mit „VideoFrameMinDelta“ ist dieser Bereich ein Hinweis auf Jitter, der durch das Netzwerk oder den Videocodec verursacht wird.

Die Summe aller Latenzwerte ist normalerweise deutlich größer als die verfügbare Framedauer bei 60 Hz. Dies ist in Ordnung, weil mehrere Frames gleichzeitig verarbeitet werden und neue Frameanforderungen mit der gewünschten Bildfrequenz ausgelöst werden. Dies ist in der Abbildung dargestellt. Wenn die Latenz aber zu groß wird, wirkt sich dies auf die Late Stage Reprojection (LSR) (Umprojizierung zu einem späten Zeitpunkt) aus und kann ggf. die allgemeine Benutzerfreundlichkeit beeinträchtigen.

VideoFramesReceived, VideoFrameReusedCount und VideoFramesDiscarded können verwendet werden, um die Netzwerk- und Serverleistung zu messen. Eine Kombination aus einem niedrigen VideoFramesReceived-Wert und einem hohen VideoFrameReusedCount-Wert kann auf eine Netzwerküberlastung oder eine schlechte Serverleistung hinweisen. Ein hoher Wert für VideoFramesDiscarded ist ebenfalls ein Hinweis auf eine Überlastung des Netzwerks.

Anhand von TimeSinceLastPresent, VideoFrameMinDelta und VideoFrameMaxDelta können Sie die Varianz von eingehenden Videoframes und lokalen Aufrufen ablesen. Eine hohe Varianz deutet auf eine instabile Bildfrequenz hin.

Keiner der obigen Werte ist ein eindeutiger Hinweis auf die reine Netzwerklatenz (rote Pfeile in der Abbildung), da der genaue Zeitraum, der vom Server für das Rendern benötigt wird, vom Roundtripwert LatencyPoseToReceive abgezogen werden muss. Der serverseitige Teil der allgemeinen Latenz enthält Informationen, die für den Client nicht verfügbar sind. Im nächsten Absatz wird jedoch erläutert, wie dieser Wert durch zusätzliche Eingaben des Servers angenähert und durch den NetworkLatencyWert dargestellt wird.

Abfragen zur Leistungsbewertung

Abfragen zur Leistungsbewertung liefern ausführlichere Informationen zur CPU- und GPU-Workload auf dem Server. Da die Daten vom Server angefordert werden, wird zum Abfragen einer Leistungsmomentaufnahme das übliche asynchrone Muster verwendet:

async void QueryPerformanceAssessment(RenderingSession session)
{
    try
    {
        PerformanceAssessment result = await session.Connection.QueryServerPerformanceAssessmentAsync();
        // do something with result...
    }
    catch (RRException ex)
    {
    }
}

void QueryPerformanceAssessment(ApiHandle<RenderingSession> session)
{
    session->Connection()->QueryServerPerformanceAssessmentAsync([](Status status, PerformanceAssessment result) {
        if (status == Status::OK)
        {
            // do something with result...
        }
    });
}

Im Gegensatz zum Objekt FrameStatistics enthält das Objekt PerformanceAssessment serverseitige Informationen:

Member	Erklärung
TimeCPU	Durchschnittliche Dauer der Server-CPU pro Frame in Millisekunden
TimeGPU	Durchschnittliche Dauer der Server-GPU pro Frame in Millisekunden
UtilizationCPU	Gesamtauslastung der Server-CPU in Prozent
UtilizationGPU	Gesamtauslastung der Server-GPU in Prozent
MemoryCPU	Gesamtauslastung des Serverhauptspeichers in Prozent
MemoryGPU	Gesamtauslastung des dedizierten Videospeichers in Prozent der Server-GPU
Netzwerklatenz	Ungefähre durchschnittliche Netzwerkroundtrip-Latenz in Millisekunden. In der obigen Abbildung entspricht dieser Wert der Summe der roten Pfeile. Der Wert wird berechnet, indem die tatsächliche Renderingdauer des Servers vom Wert `LatencyPoseToReceive` von `FrameStatistics` subtrahiert wird. Diese Annäherung ist zwar nicht genau, gibt aber einen gewissen Hinweis auf die Netzlatenz, die von den auf dem Client berechneten Latenzwerten isoliert ist.
PolygonsRendered	Die Anzahl von Dreiecken, die in einem Frame gerendert werden. Diese Zahl enthält auch die Dreiecke, die später beim Rendern herausgefiltert werden. Das bedeutet, dass diese Zahl bei verschiedenen Kamerapositionen nicht sehr stark variiert. Aber die Leistung kann drastisch variieren, abhängig von der Dreiecks-Culling-Rate.
PointsRendered	Die Anzahl der Punkte in Punktwolken, die in einem Frame gerendert werden. Hier gelten die gleichen Ausschlusskriterien wie oben `PolygonsRendered`beschrieben.

Als Hilfe beim Bewerten der Werte verfügt jeder Teil über eine Qualitätsklassifizierung wie Great (Hervorragend), Good (Gut), Mediocre (Mittel) oder Bad (Schlecht). Diese Bewertungsmetrik gibt einen groben Hinweis auf den Zustand des Servers, sollte aber nicht als absolut angesehen werden. Angenommen, für die GPU-Dauer wird eine „mittlere“ Bewertung angezeigt. Als mittelmäßig wird es angesehen, weil es nahe an der Grenze des Gesamtbudgets für die Rahmenzeit liegt. In Ihrem Fall könnte es aber dennoch ein guter Wert sein, weil Sie ein komplexes Modell rendern.

Debugausgabe für Statistik

Die Klasse ServiceStatistics ist eine C#-Klasse, die sowohl die Framestatistik als auch die Abfragen zur Leistungsbewertung umschließt und über nützliche Funktionen verfügt, mit denen Statistiken als aggregierte Werte oder als vordefinierte Zeichenfolge zurückgegeben werden können. Der folgende Code ist die einfachste Möglichkeit, um in Ihrer Clientanwendung serverseitige Statistiken anzuzeigen.

ServiceStatistics _stats = null;

void OnConnect()
{
    _stats = new ServiceStatistics();
}

void OnDisconnect()
{
    _stats = null;
}

void Update()
{
    if (_stats != null)
    {
        // update once a frame to retrieve new information and build average values
        _stats.Update(Service.CurrentActiveSession);

        // retrieve a string with relevant stats information
        InfoLabel.text = _stats.GetStatsString();
    }
}

Mit dem obigen Code wird die Beschriftung mit dem folgenden Text gefüllt:

ArrServiceStats string output

Mit der API GetStatsString wird eine Zeichenfolge mit allen Werten formatiert, aber jeder einzelne Wert kann auch programmgesteuert über die ServiceStatistics-Instanz abgefragt werden.

Es sind auch Varianten von Membern vorhanden, mit denen die Werte im Laufe der Zeit aggregiert werden. Es werden Member mit dem Suffix *Avg, *Max oder *Total angezeigt. Mit dem Member FramesUsedForAverage wird angegeben, wie viele Frames für diese Aggregation verwendet wurden.

Freigeben über

Serverseitige Leistungsabfragen

Zeitachse für Client/Server

Abfragen zur Framestatistik

Abfragen zur Leistungsbewertung

Debugausgabe für Statistik

API-Dokumentation

Nächste Schritte

Feedback

Zusätzliche Ressourcen