Escribir aplicaciones grandes y adaptativas de .NET Framework

En este artículo se ofrecen varias sugerencias para mejorar el rendimiento de las aplicaciones .NET Framework de gran tamaño o de aquellas aplicaciones que procesan una gran cantidad de datos, como archivos o bases de datos. Estas sugerencias proceden de reescribir los compiladores de C# y Visual Basic en código administrado; además, el artículo incluye varios ejemplos reales del compilador de C#.

.NET Framework es muy productivo en la compilación de aplicaciones. Gracias a unos lenguajes potentes y seguros, así como a una amplia colección de bibliotecas, la compilación de aplicaciones resulta muy fructífera. Sin embargo, una gran productividad conlleva responsabilidad. Use todas las posibilidades de .NET Framework, pero prepárese para ajustar el rendimiento del código cuando sea necesario.

Por qué el rendimiento del nuevo compilador afecta a su aplicación

El equipo .NET Compiler Platform («Roslyn») ha reescrito los compiladores de C# y Visual Basic en código administrado con el objetivo de proporcionar nuevas API para el modelado y análisis de código, la compilación de herramientas y la habilitación de experiencias, y también para permitir una experiencia mucho más enriquecedora en cuanto a código en Visual Studio. La reescritura de los compiladores y la compilación de experiencias de Visual Studio en los nuevos compiladores ha revelado información útil sobre el rendimiento que se puede emplear en cualquier aplicación de .NET Framework de gran tamaño o en cualquier aplicación que procese una gran cantidad de datos. No es necesario tener conocimientos sobre compiladores para beneficiarse de la información y los ejemplos del compilador de C#.

Visual Studio usa las API de compilador para crear todas aquellas características de IntelliSense que adoran los usuarios: coloración de identificadores y palabras clave, listas de finalización de sintaxis, líneas en zigzag de errores, sugerencias sobre parámetros, emisión de código y acciones de código. Visual Studio proporciona esta ayuda mientras los desarrolladores escriben y modifican su código; Visual Studio debe responder en todo momento mientras el compilador modela continuamente el código que editan los desarrolladores.

Cuando los usuarios finales interactúan con la aplicación, esperan una capacidad de respuesta adecuada. La escritura o la gestión de comandos nunca debe bloquearse. La ayuda debe aparecer rápidamente o desaparecer si el usuario continúa escribiendo. La aplicación debe evitar bloquear el subproceso de la interfaz de usuario con largos cálculos que ralenticen la aplicación.

Para obtener más información sobre los compiladores de Roslyn, consulte El SDK de .NET Compiler Platform.

Solo los hechos

Tenga en cuenta lo siguiente cuando ajuste el rendimiento y cree aplicaciones de .NET Framework con capacidad de respuesta.

Dato 1: Las optimizaciones prematuras no siempre valen el esfuerzo

Escribir código más complejo de lo necesario conlleva costes de mantenimiento, depuración y pulido. Los programadores experimentados saben intuitivamente cómo resolver problemas de código y cómo escribir un código más eficaz. Sin embargo, a veces optimizan el código de forma prematura. Por ejemplo, usan una tabla hash cuando con una simple matriz bastaría, o utilizan un almacenamiento en caché complicado que puede consumir memoria en vez de simplemente recalcular los valores. Incluso los programadores experimentados deben probar el rendimiento y analizar el código cuando se detectan problemas.

Hecho 2: Si no realiza mediciones, solo tiene conjeturas

Los perfiles y las medidas no mienten. Los perfiles muestran si la CPU está totalmente cargada o si hay un bloqueo en E/S de disco. Los perfiles indican el tipo y la cantidad de memoria que se está asignando y si la CPU emplea mucho tiempo en la recolección de basura.

Establezca objetivos de rendimiento para los escenarios o las experiencias de cliente claves de la aplicación y escriba pruebas para medir el rendimiento. Investigue los errores de las pruebas mediante el método científico: use perfiles como guía, cree hipótesis sobre el origen del problema y pruebe esas hipótesis con un experimento o cambio de código. Establezca una línea base de medidas de rendimiento a lo largo del tiempo con pruebas periódicas para así aislar los cambios que causan regresiones en el rendimiento. Al abordar de manera rigurosa el trabajo de rendimiento, evitará perder tiempo con actualizaciones de código que no necesita.

Hecho 3: Las herramientas de calidad marcan la diferencia

Unas herramientas de calidad permiten profundizar rápidamente en los problemas de rendimiento más importantes (CPU, memoria o disco) y sirven para localizar el código que provoca esos cuellos de botella. Microsoft distribuye diversas herramientas de rendimiento, como el generador de perfiles de Visual Studio y PerfView.

PerfView es una herramienta potente que sirve para centrarse en los problemas con raíces profundas, por ejemplo, E/S de disco, eventos de GC y memoria. Puede capturar eventos de Seguimiento de eventos para Windows (ETW) relacionados con el rendimiento y ver fácilmente información por aplicación, por proceso, por pila y por subproceso. PerfView muestra la cantidad y el tipo de memoria que asigna la aplicación, así como las funciones o pilas de llamadas que contribuyen en determinada medida a las asignaciones de memoria. Para más información, vea los completos artículos de ayuda, las demostraciones y los vídeos que se incluyen con la herramienta.

Hecho 4: La clave está en las asignaciones

Podría pensarse que la compilación de una aplicación de .NET Framework que muestre una buena capacidad de respuesta depende de la utilización de los algoritmos —como usar una ordenación rápida en vez de una de burbuja—, pero no es así. El mayor factor para desarrollar una aplicación receptiva es la asignación de memoria, especialmente cuando tu aplicación es muy grande o procesa grandes cantidades de datos.

El trabajo para construir experiencias con el IDE receptivas con las nuevas API del compilador se centró en evitar las asignaciones y administrar las estrategias de caché. El seguimiento de PerfView muestra que el rendimiento de los nuevos compiladores de C# y Visual Basic rara vez está asociado a la CPU. Los compiladores pueden estar asociados a E/S al leer miles o millones de líneas de código, al leer metadatos o al emitir código generado. Los retrasos del subproceso de la interfaz de usuario son casi todos debidos a la recolección de basura. La GC de .NET Framework está ajustada para optimizar el rendimiento y una gran parte de su trabajo se realiza mientras se ejecuta el código de la aplicación. Pero una única asignación puede desencadenar una costosa recolección gen2, deteniendo todos los subprocesos.

Asignaciones comunes y ejemplos

Las expresiones de ejemplo incluidas en esta sección tienen asignaciones ocultas que parecen pequeñas. Sin embargo, si una aplicación grande ejecuta las expresiones suficientes veces, pueden causar cientos de megabytes, e incluso gigabytes, de asignaciones. Por ejemplo, durante las pruebas de un minuto en las que se simulaba la escritura de un desarrollador en el editor se asignaron gigabytes de memoria, y esto hizo que el equipo de rendimiento se centrase en los escenarios de escritura.

Boxeo

Los boxing ocurren cuando tipos de valor que normalmente residen en la pila o en estructuras de datos se encapsulan en un objeto. Es decir, se asigna un objeto para contener los datos y luego se devuelve un puntero al objeto. .NET Framework a veces realiza un encasillado de valores debido a la firma de un método o al tipo de la ubicación de almacenamiento. El encapsulamiento de un tipo de valor en un objeto obliga a asignar memoria. Muchas operaciones de boxing pueden sumar megabytes o gigabytes de asignaciones a tu aplicación, lo que significa que esta provocará más GCs. El .NET Framework y los compiladores de lenguajes evitan el proceso de 'boxing' siempre que pueden, pero a veces se produce en el momento menos esperado.

Para ver boxing en PerfView, abra una traza y observe GC Heap Alloc Stacks en el nombre del proceso de su aplicación (recuerde, PerfView informa de todos los procesos). Si ve tipos como System.Int32 y System.Char en las asignaciones, está realizando un boxing de tipos de valores. Si se elige uno de estos tipos, se mostrarán las pilas y funciones en las que están encapsuladas.

Ejemplo 1: métodos de cadena y argumentos de tipo de valor

En este código de ejemplo se ilustra un potencialmente innecesario y excesivo boxing:

public class Logger
{
    public static void WriteLine(string s) { /*...*/ }
}

public class BoxingExample
{
    public void Log(int id, int size)
    {
        var s = string.Format("{0}:{1}", id, size);
        Logger.WriteLine(s);
    }
}

El código proporciona funcionalidad de registro, por lo que la aplicación puede llamar a la función Log frecuentemente, quizá millones de veces. El problema es que la llamada a string.Format se resuelve en la sobrecarga de Format(String, Object, Object).

Esta sobrecarga requiere que .NET Framework realice un 'boxing' de los valores int para convertirlos en objetos y pasarlos a esta llamada de método. Una solución parcial es llamar a id.ToString() y size.ToString(), y pasar todas las cadenas (que son objetos) a la llamada string.Format. Llamar a ToString() sí asigna una cadena, pero esa asignación ocurrirá de todos modos dentro de string.Format.

Puede considerar que esta llamada básica a string.Format es simplemente concatenación de cadenas, por lo que puede escribir este código en su lugar:

var s = id.ToString() + ':' + size.ToString();

No obstante, esa línea de código introduce una asignación boxing porque se compila en Concat(Object, Object, Object). .NET Framework debe realizar una encapsulación del literal de carácter para invocar a Concat.

Corrección para el ejemplo 1

La solución es sencilla. Simplemente reemplace el literal de carácter por un literal de cadena, esto no provoca boxing porque las cadenas ya son objetos.

var s = id.ToString() + ":" + size.ToString();

Ejemplo 2: boxing de enum

Este ejemplo fue el causante de una cantidad enorme de asignación en los nuevos compiladores de C# y Visual Basic debido al uso frecuente de tipos de enumeración, especialmente en operaciones de búsqueda en diccionarios.

public enum Color
{
    Red, Green, Blue
}

public class BoxingExample
{
    private string name;
    private Color color;
    public override int GetHashCode()
    {
        return name.GetHashCode() ^ color.GetHashCode();
    }
}

Este problema es muy sutil. PerfView consideraba esto como una conversión boxing de GetHashCode(), ya que, por motivos de implementación, el método realiza una conversión boxing de la representación subyacente del tipo de enumeración. Si observa detenidamente en PerfView, puede ver dos asignaciones de boxing para cada llamada a GetHashCode(). El compilador inserta una y .NET Framework inserta la otra.

Corrección para el ejemplo 2

Es muy fácil evitar ambas asignaciones si se convierte a la representación subyacente antes de llamar a GetHashCode():

((int)color).GetHashCode()

Otra fuente común de boxing en tipos de enumeración es el método Enum.HasFlag(Enum). El argumento pasado a HasFlag(Enum) debe ser encapsulado. En la mayoría de los casos, reemplazar llamadas a Enum.HasFlag(Enum) por una prueba bit a bit es más sencillo y sin asignación.

No olvide el primer hecho de rendimiento (no optimice prematuramente) y no empiece a reescribir todo su código de este modo. Tenga en cuenta los costes de boxing, pero, antes de cambiar el código, perfile su aplicación e identifique las áreas de rendimiento crítico.

Cadenas

La manipulación de cadenas es uno de los mayores causantes de las asignaciones y con frecuencia aparece en PerfView entre las cinco principales asignaciones. Los programas usan cadenas para serialización, JSON y API REST. Las cadenas se pueden usar como constantes de programación para interoperar con sistemas cuando no se pueden usar tipos de enumeración. Cuando el perfilado muestra que las cadenas están impactando significativamente el rendimiento, busque llamadas a métodos String como Format, Concat, Split, Join, Substring, etc. El uso de StringBuilder para evitar crear una cadena a partir de muchos fragmentos sirve de ayuda, pero incluso la asignación del objeto StringBuilder puede originar un cuello de botella que debes gestionar.

Ejemplo 3: operaciones de cadena

El compilador de C# tenía este código que escribe el texto de un comentario de documento XML con formato:

public void WriteFormattedDocComment(string text)
{
    string[] lines = text.Split(new[] { "\r\n", "\r", "\n" },
                                StringSplitOptions.None);
    int numLines = lines.Length;
    bool skipSpace = true;
    if (lines[0].TrimStart().StartsWith("///"))
    {
        for (int i = 0; i < numLines; i++)
        {
            string trimmed = lines[i].TrimStart();
            if (trimmed.Length < 4 || !char.IsWhiteSpace(trimmed[3]))
            {
                skipSpace = false;
                break;
            }
        }
        int substringStart = skipSpace ? 4 : 3;
        for (int i = 0; i < numLines; i++)
            WriteLine(lines[i].TrimStart().Substring(substringStart));
    }
    else { /* ... */ }

Como se puede ver, en este código hay mucha manipulación de cadenas. El código usa métodos de biblioteca para dividir líneas en cadenas independientes, para reducir espacio en blanco, para comprobar si el argumento text es un comentario de documentación XML y para extraer subcadenas de las líneas.

En la primera línea dentro de WriteFormattedDocComment, la llamada text.Split asigna una nueva matriz de tres elementos como argumento cada vez que se llama. El compilador tiene que emitir código para asignar esta matriz en cada ocasión. Eso se debe a que el compilador no sabe si Split almacena la matriz en algún lugar donde pueda ser modificada por otro código, lo que afectaría a las llamadas posteriores a WriteFormattedDocComment. La llamada a Split también asigna una cadena para cada línea en text y asigna otra memoria para realizar la operación.

WriteFormattedDocComment tiene tres llamadas al método TrimStart. Dos están en bucles internos que duplican el trabajo y las asignaciones. Para empeorar las cosas, la llamada al método TrimStart sin argumentos asigna una matriz vacía (para el parámetro params) además del resultado de la cadena.

Por último, hay una llamada al método Substring, que normalmente asigna una cadena nueva.

Corrección para el ejemplo 3

A diferencia de los ejemplos anteriores, estas asignaciones no se pueden resolver con pequeñas modificaciones. Es necesario dar un paso atrás, observar el problema y enfocarlo de manera diferente. Por ejemplo, observará que el argumento para WriteFormattedDocComment() es una cadena que tiene toda la información que necesita el método, por lo que el código podría hacer más labores de indización en vez de asignar muchas cadenas parciales.

El equipo de rendimiento del compilador abordó estas asignaciones con un código como el siguiente:

private int IndexOfFirstNonWhiteSpaceChar(string text, int start) {
    while (start < text.Length && char.IsWhiteSpace(text[start])) start++;
    return start;
}

private bool TrimmedStringStartsWith(string text, int start, string prefix) {
    start = IndexOfFirstNonWhiteSpaceChar(text, start);
    int len = text.Length - start;
    if (len < prefix.Length) return false;
    for (int i = 0; i < len; i++)
    {
        if (prefix[i] != text[start + i]) return false;
    }
    return true;
}

// etc...

La primera versión de WriteFormattedDocComment() asignaba una matriz, varias subcadenas y una subcadena recortada junto con una matriz params vacía. También buscaba «///». El código revisado solo usa la indización y no realiza ninguna asignación. Busca el primer carácter que no es un espacio en blanco y luego comprueba cada uno de los caracteres para ver si la cadena empieza por «///». El código nuevo usa IndexOfFirstNonWhiteSpaceChar en vez de TrimStart para devolver el primer índice (tras un índice de inicio especificado) en el que haya un carácter distinto del espacio en blanco. La corrección no está completa, pero sirve para comprobar cómo se aplican correcciones similares para obtener una solución completa. Al aplicar este enfoque en todo el código, se pueden quitar todas las asignaciones en WriteFormattedDocComment().

Ejemplo 4: StringBuilder

En este ejemplo se usa un objeto StringBuilder. La función siguiente genera un nombre de tipo completo para tipos genéricos:

public class Example
{
    // Constructs a name like "SomeType<T1, T2, T3>"
    public string GenerateFullTypeName(string name, int arity)
    {
        StringBuilder sb = new StringBuilder();

        sb.Append(name);
        if (arity != 0)
        {
            sb.Append("<");
            for (int i = 1; i < arity; i++)
            {
                sb.Append("T"); sb.Append(i.ToString()); sb.Append(", ");
            }
            sb.Append("T"); sb.Append(i.ToString()); sb.Append(">");
        }

        return sb.ToString();
    }
}

El foco está en la línea que crea una nueva instancia StringBuilder. El código genera una asignación para sb.ToString() y asignaciones internas dentro de la implementación StringBuilder, pero no puedes controlar esas asignaciones si quieres obtener el resultado como cadena.

Corrección para el ejemplo 4

Para corregir la asignación del objeto StringBuilder, almacene el objeto en la memoria caché. El almacenamiento en caché de una única instancia que podría desecharse puede mejorar el rendimiento de manera significativa. Esta es la nueva implementación de la función, que omite todo el código excepto las nuevas líneas primera y última:

// Constructs a name like "MyType<T1, T2, T3>"
public string GenerateFullTypeName(string name, int arity)
{
    StringBuilder sb = AcquireBuilder();
    /* Use sb as before */
    return GetStringAndReleaseBuilder(sb);
}

Las partes clave son las nuevas funciones AcquireBuilder() y GetStringAndReleaseBuilder():

[ThreadStatic]
private static StringBuilder cachedStringBuilder;

private static StringBuilder AcquireBuilder()
{
    StringBuilder result = cachedStringBuilder;
    if (result == null)
    {
        return new StringBuilder();
    }
    result.Clear();
    cachedStringBuilder = null;
    return result;
}

private static string GetStringAndReleaseBuilder(StringBuilder sb)
{
    string result = sb.ToString();
    cachedStringBuilder = sb;
    return result;
}

Dado que los nuevos compiladores usan subprocesos, estas implementaciones utilizan un campo estático de subproceso (atributo ThreadStaticAttribute) para almacenar en la caché el StringBuilder, con lo que probablemente se pueda renunciar a la declaración ThreadStatic. El campo estático de subproceso contiene un valor único para cada subproceso que ejecuta este código.

AcquireBuilder() devuelve la instancia StringBuilder almacenada en la caché (si la hay) después de borrarla y establecer el campo o la caché en null. De lo contrario, AcquireBuilder() crea una instancia nueva y la devuelve, dejando el campo o la caché establecidos en null.

Cuando haya acabado con StringBuilder, llame a GetStringAndReleaseBuilder() para obtener el resultado de la cadena, guarde la instancia StringBuilder en el campo o en la caché, y después devuelva el resultado. Es posible que en la ejecución se vuelva a introducir este código y se creen varios objetos StringBuilder (aunque rara vez ocurre). El código solo guarda la última instancia StringBuilder liberada para su uso posterior. Esa sencilla estrategia de almacenamiento en caché redujo significativamente las asignaciones en los nuevos compiladores. Hay partes de .NET Framework y MSBuild ("MSBuild") que usan una técnica similar para mejorar el rendimiento.

Esta estrategia simple de almacenamiento en caché respeta el buen diseño de caché porque tiene un límite de tamaño. No obstante, hay más código ahora que en el original, lo que significa un mayor coste de mantenimiento. Únicamente debe adoptar la estrategia de almacenamiento en caché si se ha encontrado con un problema de rendimiento y PerfView muestra que las asignaciones de StringBuilder suponen una contribución significativa.

LINQ y lambdas

Language-Integrated Query (LINQ), junto con las expresiones lambda, es un ejemplo de una característica de productividad. Sin embargo, su uso puede tener un impacto significativo en el rendimiento a lo largo del tiempo, y es posible que tenga que volver a escribir el código.

Ejemplo 5: lambdas, List<T> e IEnumerable<T>

En este ejemplo se usa LINQ y código de estilo funcional para buscar un símbolo en el modelo del compilador, dada una cadena de nombre:

class Symbol {
    public string Name { get; private set; }
    /*...*/
}

class Compiler {
    private List<Symbol> symbols;
    public Symbol FindMatchingSymbol(string name)
    {
        return symbols.FirstOrDefault(s => s.Name == name);
    }
}

El nuevo compilador y las experiencias de IDE creadas en él llaman a FindMatchingSymbol() con mucha frecuencia, y hay varias asignaciones ocultas en la única línea de código de esta función. Para examinar estas asignaciones, primero divida la única línea de código de la función en dos líneas:

Func<Symbol, bool> predicate = s => s.Name == name;
     return symbols.FirstOrDefault(predicate);

En la primera línea, la expresión lambdas => s.Name == namecierra la variable local name. Esto significa que, además de asignar un objeto para el delegado que contiene predicate, el código asigna una clase estática para contener el entorno que captura el valor de name. El compilador genera código como el siguiente:

// Compiler-generated class to hold environment state for lambda
private class Lambda1Environment
{
    public string capturedName;
    public bool Evaluate(Symbol s)
    {
        return s.Name == this.capturedName;
    }
}

// Expanded Func<Symbol, bool> predicate = s => s.Name == name;
Lambda1Environment l = new Lambda1Environment() { capturedName = name };
var predicate = new Func<Symbol, bool>(l.Evaluate);

Las dos asignaciones new (una para la clase de entorno y la otra para el delegado) son ahora explícitas.

Ahora observe la llamada a FirstOrDefault. Este método de extensión en el tipo System.Collections.Generic.IEnumerable<T> también implica una asignación. Dado que FirstOrDefault toma un objeto IEnumerable<T> como primer argumento, se puede expandir la llamada al código siguiente (un poco simplificado para el análisis):

// Expanded return symbols.FirstOrDefault(predicate) ...
     IEnumerable<Symbol> enumerable = symbols;
     IEnumerator<Symbol> enumerator = enumerable.GetEnumerator();
     while(enumerator.MoveNext())
     {
         if (predicate(enumerator.Current))
             return enumerator.Current;
     }
     return default(Symbol);

La variable symbols tiene el tipo List<T>. El tipo de colección List<T> implementa IEnumerable<T> y define inteligentemente un enumerador (interfaz IEnumerator<T>) que List<T> implementa con una struct. Usar una estructura en vez de una clase significa que normalmente se evitan asignaciones en el montón, lo que, a su vez, puede afectar al rendimiento de la recolección de basura. Por lo general, los enumeradores se utilizan con el bucle foreach del lenguaje, empleando la estructura del enumerador tal como se devuelve en la pila de llamadas. El incremento del puntero de la pila de llamadas para dejar sitio a un objeto no afecta a GC del modo que lo hace una asignación del montón.

En el caso de la llamada FirstOrDefault expandida, el código necesita llamar a GetEnumerator() en un IEnumerable<T>. Asignar symbols a la variable enumerable de tipo IEnumerable<Symbol> hace que se pierda la información de que el objeto real es un List<T>. Esto significa que cuando el código captura al enumerador con enumerable.GetEnumerator(), .NET Framework tiene que realizar una conversión boxing de la estructura devuelta para asignarla a la variable enumerator.

Corrección para el ejemplo 5

En esta corrección, FindMatchingSymbol se reescribe para reemplazar la única línea de código con seis líneas de código que siguen siendo concisas, fáciles de leer y entender, y sencillas de mantener:

public Symbol FindMatchingSymbol(string name)
    {
        foreach (Symbol s in symbols)
        {
            if (s.Name == name)
                return s;
        }
        return null;
    }

El código no utiliza métodos de extensión LINQ, lambdas ni enumeradores, y no crea asignaciones. No hay asignaciones porque el compilador puede ver que la colección symbols es una List<T> y puede vincular el enumerador resultante (una estructura) a una variable local con el tipo correcto para evitar el boxing. La versión original de esta función es un gran ejemplo del poder expresivo de C# y de la productividad .NET Framework. Esta nueva y más eficaz versión conserva esas cualidades sin agregar ningún código complejo que haya que mantener.

Almacenamiento en caché del método asincrónico

En el ejemplo siguiente se muestra un problema común al intentar usar resultados de la caché en un método async.

Ejemplo 6: almacenamiento en caché en métodos asincrónicos

Las características del IDE de Visual Studio incorporadas a los nuevos compiladores de C# y Visual Basic suelen capturar árboles de sintaxis y, cuando eso sucede, los compiladores usan asincronía para que Visual Studio siga respondiendo. Esta es la primera versión del código que puede escribir para obtener un árbol de sintaxis:

class SyntaxTree { /*...*/ }

class Parser { /*...*/
    public SyntaxTree Syntax { get; }
    public Task ParseSourceCode() { /*...*/ }
}

class Compilation { /*...*/
    public async Task<SyntaxTree> GetSyntaxTreeAsync()
    {
        var parser = new Parser(); // allocation
        await parser.ParseSourceCode(); // expensive
        return parser.Syntax;
    }
}

Como se puede ver, la llamada a GetSyntaxTreeAsync() crea una instancia de Parser, analiza el código y luego devuelve un objeto Task, Task<SyntaxTree>. La parte costosa es asignar la instancia Parser y analizar el código. La función devuelve Task, para que los llamadores puedan aguardar el trabajo de análisis y liberar el hilo de la interfaz de usuario para que responda a la entrada del usuario.

Hay varias características de Visual Studio que pueden intentar obtener el mismo árbol de sintaxis; por tanto, se puede escribir el código siguiente para almacenar en caché el resultado del análisis a fin de ahorrar tiempo y asignaciones. No obstante, este código implica una asignación.

class Compilation { /*...*/

    private SyntaxTree cachedResult;

    public async Task<SyntaxTree> GetSyntaxTreeAsync()
    {
        if (this.cachedResult == null)
        {
            var parser = new Parser(); // allocation
            await parser.ParseSourceCode(); // expensive
            this.cachedResult = parser.Syntax;
        }
        return this.cachedResult;
    }
}

Como puede ver, el nuevo código con almacenamiento en caché tiene un campo SyntaxTree denominado cachedResult. Cuando este campo es null, GetSyntaxTreeAsync() hace el trabajo y guarda el resultado en la caché. GetSyntaxTreeAsync() devuelve el objeto SyntaxTree. El problema es que cuando se tiene una función async de tipo Task<SyntaxTree>, y se devuelve un valor de tipo SyntaxTree, el compilador emite código para asignar una tarea que contenga el resultado (mediante Task<SyntaxTree>.FromResult()). La tarea se marca como completada y el resultado está disponible de inmediato. En el código de los nuevos compiladores, la aparición de objetos Task que ya se habían completado se producía tan a menudo que corregir estas asignaciones mejoró sensiblemente la respuesta.

Corrección para el ejemplo 6

Para quitar la asignación Task completada, puede almacenar el objeto de tarea con el resultado completado:

class Compilation { /*...*/

    private Task<SyntaxTree> cachedResult;

    public Task<SyntaxTree> GetSyntaxTreeAsync()
    {
        return this.cachedResult ??
               (this.cachedResult = GetSyntaxTreeUncachedAsync());
    }

    private async Task<SyntaxTree> GetSyntaxTreeUncachedAsync()
    {
        var parser = new Parser(); // allocation
        await parser.ParseSourceCode(); // expensive
        return parser.Syntax;
    }
}

Este código cambia el tipo de cachedResult a Task<SyntaxTree> y emplea una función del asistente async que contiene el código original de GetSyntaxTreeAsync(). GetSyntaxTreeAsync() ahora usa el operador de coalescencia nula para devolver cachedResult si no es nulo. Si cachedResult es null, entonces GetSyntaxTreeAsync() llama a GetSyntaxTreeUncachedAsync() y almacena el resultado en la caché. Observe que GetSyntaxTreeAsync() no aguarda por la llamada a GetSyntaxTreeUncachedAsync(), como haría el código normalmente. No usar await significa que cuando GetSyntaxTreeUncachedAsync() devuelve su objeto Task, GetSyntaxTreeAsync() devuelve inmediatamente Task. Ahora, el resultado almacenado en la caché es Task, por lo que no hay asignaciones para devolverlo.

Consideraciones adicionales

A continuación se señalan otras cuestiones sobre aplicaciones grandes o que procesan una gran cantidad de datos.

Diccionarios

Los diccionarios son omnipresentes en muchos programas: resultan muy prácticos y son eficaces de manera inherente. Sin embargo, a menudo se usa de forma inapropiada. En Visual Studio y los nuevos compiladores, el análisis muestra que muchos de los diccionarios contenían un único elemento o estaban vacíos. Un Dictionary<TKey,TValue> vacío tiene diez campos y ocupa 48 bytes en el heap de una máquina x86. Los diccionarios son estupendos cuando se necesita una asignación o una estructura de datos asociativa con acceso en tiempo constante. No obstante, cuando solo se tienen unos pocos elementos, el usar un diccionario es una pérdida de espacio. En su lugar, por ejemplo, se puede realizar una búsqueda iterativa por un List<KeyValuePair\<K,V>> sin perder velocidad. Si usa un diccionario solo para cargarlo con datos y luego leerlos (un modelo muy común), usar una matriz ordenada con una búsqueda N(log(N)) puede resultar casi tan rápido, en función del número de elementos que se use.

Clases frente a estructuras

En cierto modo, las clases y las estructuras ofrecen la clásica compensación entre espacio y tiempo a la hora de ajustar las aplicaciones. Las clases generan 12 bytes de sobrecarga en una máquina x86 aunque no tengan campos, pero pasarlas no resulta costoso ya que solo se necesita un puntero para hacer referencia a una instancia de clase. Las estructuras no crean asignaciones del montón si no se les aplica una conversión boxing, pero cuando se pasan estructuras grandes como argumentos de función o valores devueltos, se consume tiempo de CPU para copiar atómicamente todos los miembros de datos de las estructuras. Controle las llamadas repetidas a propiedades que devuelvan estructuras y almacene en la caché el valor de la propiedad en una variable local para evitar el exceso de copia de datos.

Caches

Un truco de rendimiento muy habitual es almacenar los resultados en la caché. Sin embargo, una caché sin un límite de tamaño o una política de eliminación puede conllevar una fuga de memoria. Si, al procesar grandes cantidades de datos, usas mucha memoria en las cachés, puedes causar que la recolección de basura anule los beneficios de las búsquedas en caché.

En este artículo, discutimos la importancia de estar al tanto de los síntomas de cuello de botella de rendimiento que pueden afectar la capacidad de respuesta de su aplicación, especialmente en sistemas grandes o que procesan una gran cantidad de datos. Los causantes más habituales son el boxing, las manipulaciones de cadenas, LINQ y lambda, el almacenamiento en caché en métodos asíncronos, el uso de la memoria caché sin un límite de tamaño o política de eliminación, la utilización inadecuada de diccionarios y el pase de estructuras. No olvide los cuatro hechos sobre el ajuste de las aplicaciones:

No optimice prematuramente: sea productivo y ajuste la aplicación cuando detecte problemas.
Los perfiles no mienten: si no mide, usted conjetura.
Unas herramientas buenas marcan la diferencia: descargue PerfView y pruébelo.
La clave son las asignaciones: es donde el equipo de la plataforma de compiladores invirtió más tiempo en mejorar el rendimiento de los nuevos compiladores.

Consulte también

Comentarios

¿Le resultó útil esta página?

Last updated on 2023-05-09