Conventions de codage F#

Les conventions suivantes sont formulées à partir de l’expérience d’utilisation de grandes codebases F#. Les Cinq principes d’un code F# efficace constituent la base de chaque recommandation. Elles sont liées aux instructions de conception du composant F#, mais s’appliquent à tout code F#, et pas seulement aux composants tels que les bibliothèques.

Organisation du code

F# propose deux méthodes principales pour organiser le code : les modules et les espaces de noms. Celles-ci sont similaires, mais présentent les différences suivantes :

Les espaces de noms sont compilés en tant qu’espaces de noms .NET. Les modules sont compilés en tant que classes statiques.
Les espaces de noms sont toujours de niveau supérieur. Les modules peuvent être de niveau supérieur et imbriqués dans d’autres modules.
Les espaces de noms peuvent s’étendre sur plusieurs fichiers. Les modules ne peuvent pas.
Les modules peuvent être agrémentés avec [<RequireQualifiedAccess>] et [<AutoOpen>].

Les instructions suivantes vous aideront à les utiliser pour organiser votre code.

Préférer les espaces de noms au niveau supérieur

Pour tout code publiquement consommable, les espaces de noms sont préférables face aux modules au niveau supérieur. Étant donné qu’ils sont compilés en tant qu’espaces de noms .NET, ils sont consommables à partir de C# sans avoir recours à using static.

// Recommended.
namespace MyCode

type MyClass() =
    ...

L’utilisation d’un module de niveau supérieur peut ne pas sembler différente lorsqu’on l’appelle uniquement depuis F#, mais pour les utilisateurs C#, ces derniers peuvent être surpris de devoir qualifier MyClass avec le module MyCode s’ils ne connaissent pas la construction C# spécifique using static.

// Will be seen as a static class outside F#
module MyCode

type MyClass() =
    ...

Appliquer soigneusement `[<AutoOpen>]`

La construction [<AutoOpen>] peut polluer l’étendue de ce qui est disponible pour les appelants, et la réponse à d’où vient quelque chose est « magique ». Ce n’est pas une bonne chose. Une exception à cette règle est la bibliothèque principale F# elle-même (bien que ce fait soit également un peu controversé).

Toutefois, il est pratique si vous disposez de fonctionnalités d’assistance pour une API publique que vous souhaitez organiser séparément de cette API publique.

module MyAPI =
    [<AutoOpen>]
    module private Helpers =
        let helper1 x y z =
            ...

    let myFunction1 x =
        let y = ...
        let z = ...

        helper1 x y z

Cela vous permet de séparer proprement les détails de l’implémentation de l’API publique d’une fonction sans avoir à qualifier entièrement une assistance chaque fois que vous l’appelez.

En outre, l’exposition des méthodes d’extension et des générateurs d’expressions au niveau de l’espace de noms peut être clairement exprimée avec [<AutoOpen>].

Utilisez `[<RequireQualifiedAccess>]` chaque fois que les noms peuvent entrer en conflit ou que vous pensez que cela aide à la lisibilité

L’ajout de l’attribut [<RequireQualifiedAccess>] à un module indique que le module ne peut pas être ouvert et que les références aux éléments du module nécessitent un accès qualifié explicite. Par exemple, le module Microsoft.FSharp.Collections.List a cet attribut.

Il est utile quand les fonctions et les valeurs du module ont des noms susceptibles d’entrer en conflit avec les noms d’autres modules. L’exigence d’un accès qualifié peut considérablement augmenter la facilité de maintenance à long terme et la capacité d’une bibliothèque à évoluer.

[<RequireQualifiedAccess>]
module StringTokenization =
    let parse s = ...

...

let s = getAString()
let parsed = StringTokenization.parse s // Must qualify to use 'parse'

Trier les instructions `open` de manière topologique

En F#, l’ordre des déclarations importe, y compris avec open des instructions (et open type, simplement appelé open plus loin). Cela est différent de C#, où l’effet de using et using static est indépendant de l’ordre de ces instructions dans un fichier.

Dans F#, les éléments importés dans une portée peuvent masquer d'autres éléments déjà présents. Cela signifie que la réorganisation des instructions open peut modifier la signification du code. Par conséquent, tout tri arbitraire de toutes les instructions open (par exemple, alphanumérique) n’est pas recommandé, au risque de générer un comportement différent de celui que vous attendez.

Au lieu de cela, nous vous recommandons de les trier de manière topologique, c’est-à-dire, classer vos open instructions dans l’ordre dans lequel les couches de votre système sont définies. Le tri alphanumérique au sein de différentes couches topologiques peut également être envisagé.

Par exemple, voici le tri topologique pour le fichier d’API publique du service de compilateur F# :

namespace Microsoft.FSharp.Compiler.SourceCodeServices

open System
open System.Collections.Generic
open System.Collections.Concurrent
open System.Diagnostics
open System.IO
open System.Reflection
open System.Text

open FSharp.Compiler
open FSharp.Compiler.AbstractIL
open FSharp.Compiler.AbstractIL.Diagnostics
open FSharp.Compiler.AbstractIL.IL
open FSharp.Compiler.AbstractIL.ILBinaryReader
open FSharp.Compiler.AbstractIL.Internal
open FSharp.Compiler.AbstractIL.Internal.Library

open FSharp.Compiler.AccessibilityLogic
open FSharp.Compiler.Ast
open FSharp.Compiler.CompileOps
open FSharp.Compiler.CompileOptions
open FSharp.Compiler.Driver

open Internal.Utilities
open Internal.Utilities.Collections

Un saut de ligne sépare les couches topologiques, qui sont ensuite triées par ordre alphanumérique. Cela organise proprement le code sans masquer accidentellement les valeurs.

Utiliser des classes pour contenir des valeurs qui ont des effets secondaires

Il arrive souvent que l’initialisation d’une valeur ait des effets secondaires, tels que l’instanciation d’un contexte dans une base de données ou une autre ressource distante. Il est tentant d’initialiser de telles choses dans un module et de les utiliser dans les fonctions suivantes :

// Not recommended, side-effect at static initialization
module MyApi =
    let dep1 = File.ReadAllText "/Users/<name>/config-options.txt"
    let dep2 = Environment.GetEnvironmentVariable "DEP_2"

    let private r = Random()
    let dep3() = r.Next() // Problematic if multiple threads use this

    let function1 arg = doStuffWith dep1 dep2 dep3 arg
    let function2 arg = doStuffWith dep1 dep2 dep3 arg

C’est souvent problématique pour plusieurs raisons :

Tout d’abord, la configuration de l’application est poussée dans la codebase avec dep1 et dep2. C’est difficile à gérer dans des codebases plus volumineuses.

Deuxièmement, les données initialisées statiquement ne doivent pas inclure de valeurs qui ne sont pas thread-safe si votre composant utilise lui-même plusieurs threads. Cela est clairement violé par dep3.

Enfin, l’initialisation du module est compilée en un constructeur statique pour l’ensemble de l’unité de compilation. Si une erreur se produit lors de l’initialisation de la valeur liée par let dans ce module, elle se manifeste sous la forme d’un TypeInitializationException qui est ensuite mis en cache pendant toute la durée de vie de l’application. Ceci peut être difficile à diagnostiquer. Il existe généralement une exception interne que vous pouvez tenter de raisonner, mais si ce n’est pas le cas, il n’est pas possible de déterminer la cause racine.

Au lieu de cela, utilisez simplement une classe simple pour contenir des dépendances :

type MyParametricApi(dep1, dep2, dep3) =
    member _.Function1 arg1 = doStuffWith dep1 dep2 dep3 arg1
    member _.Function2 arg2 = doStuffWith dep1 dep2 dep3 arg2

Cette option permet :

Déplacer tout état dépendant hors de l'API.
La configuration peut maintenant être effectuée en dehors de l’API.
Les erreurs d’initialisation des valeurs dépendantes ne sont pas susceptibles de se manifester en tant que TypeInitializationException.
L’API est désormais plus facile à tester.

Gestion des erreurs

La gestion des erreurs dans les grands systèmes est une entreprise complexe et nuancée, et il n’y a pas de solution miracle pour s’assurer que vos systèmes sont tolérants aux pannes et se comportent bien. Les instructions suivantes fournissent des conseils pour faciliter cette gestion complexe.

Représenter des cas d’erreur et un état illégal dans les types intrinsèques à votre domaine

Avec les unions discriminées, F# vous permet de représenter l’état de programme défectueux dans votre système de type. Par exemple :

type MoneyWithdrawalResult =
    | Success of amount:decimal
    | InsufficientFunds of balance:decimal
    | CardExpired of DateTime
    | UndisclosedFailure

Dans ce cas, il existe trois façons connues dont le retrait d’argent d’un compte bancaire peut échouer. Chaque cas d’erreur est représenté dans le type et peut donc être traité en toute sécurité tout au long du programme.

let handleWithdrawal amount =
    let w = withdrawMoney amount
    match w with
    | Success am -> printfn $"Successfully withdrew %f{am}"
    | InsufficientFunds balance -> printfn $"Failed: balance is %f{balance}"
    | CardExpired expiredDate -> printfn $"Failed: card expired on {expiredDate}"
    | UndisclosedFailure -> printfn "Failed: unknown"

En règle générale, si vous pouvez modéliser les différentes façons dont quelque chose peut échouer dans votre domaine, le code de gestion des erreurs n’est plus traité comme quelque chose que vous devez gérer en plus du flux de programme normal. Il s’agit simplement d’une partie du flux normal du programme et n’est pas considéré comme exceptionnel. Il existe deux grands avantages :

Il est plus facile à gérer à mesure que votre domaine change au fil du temps.
Les cas d’erreur sont plus faciles à tester unitairement.

Utiliser des exceptions lorsque les erreurs ne peuvent pas être représentées avec des types

Toutes les erreurs ne peuvent pas être représentées dans un domaine problématique. Ces types de fautes sont de nature exceptionnelle, d’où la possibilité de lever et d’intercepter des exceptions dans F#.

Tout d’abord, il est recommandé de lire les Instructions relatives à la conception des exceptions. Elles s’appliquent également à F#.

Les principales constructions disponibles dans F# à des fins de levée d’exceptions doivent être considérées dans l’ordre de préférence suivant :

Fonction	Syntaxe	Objectif
`nullArg`	`nullArg "argumentName"`	Déclenche un `System.ArgumentNullException` avec le nom de l’argument spécifié.
`invalidArg`	`invalidArg "argumentName" "message"`	Déclenche un `System.ArgumentException` avec un nom d’argument et un message spécifiés.
`invalidOp`	`invalidOp "message"`	Déclenche un `System.InvalidOperationException` avec le message spécifié.
`raise`	`raise (ExceptionType("message"))`	Mécanisme général pour lever des exceptions.
`failwith`	`failwith "message"`	Déclenche un `System.Exception` avec le message spécifié.
`failwithf`	`failwithf "format string" argForFormatString`	Déclenche un `System.Exception` avec un message déterminé par la chaîne de format et ses entrées.

Utilisez nullArg, invalidArg et invalidOp comme mécanisme pour lever ArgumentNullException, ArgumentException et InvalidOperationException, le cas échéant.

Les fonctions failwith et failwithf doivent généralement être évitées, car elles soulèvent le type Exception de base, et non une exception spécifique. Conformément aux Instructions relatives à la conception des exceptions, vous devez lever des exceptions plus spécifiques lorsque vous le pouvez.

Utiliser la syntaxe de gestion des exceptions

F# prend en charge les modèles d’exception via la syntaxe try...with :

try
    tryGetFileContents()
with
| :? System.IO.FileNotFoundException as e -> // Do something with it here
| :? System.Security.SecurityException as e -> // Do something with it here

Concilier la fonctionnalité lors d'une exception avec la correspondance de motifs peut être un peu délicat si vous souhaitez garder le code propre. Une façon de gérer cela consiste à utiliser des modèles actifs comme un moyen de regrouper les fonctionnalités entourant un cas d’erreur avec une exception elle-même. Par exemple, vous pouvez consommer une API qui, lorsqu’elle lève une exception, enferme des informations précieuses dans les métadonnées d’exception. Désenvelopper une valeur utile dans le corps de l’exception capturée à l’intérieur du modèle actif et retourner cette valeur peut être utile dans certaines situations.

Ne pas utiliser la gestion des erreurs monadiques pour remplacer les exceptions

Les exceptions sont souvent considérées comme un tabou dans le paradigme fonctionnel pur. En effet, les exceptions violent la pureté, il est donc sûr de les considérer comme pas tout à fait pures sur le plan fonctionnel. Toutefois, cela ignore la réalité selon laquelle le code doit s’exécuter et que des erreurs d’exécution peuvent se produire. En général, écrivez du code en supposant que la plupart des choses ne sont pas pures ou totales, afin de minimiser les surprises désagréables (comme le catch vide dans C# ou la mauvaise gestion de l’arborescence des appels de procédure, qui permet de rejeter des informations).

Il est important de prendre en compte les principaux points forts/aspects suivants des exceptions en ce qui concerne leur pertinence et leur adéquation dans l’ensemble de l’écosystème du runtime .NET et de l’interlangage :

Ils contiennent des informations de diagnostic détaillées, qui sont utiles pour déboguer un problème.
Ils sont bien compris par le runtime et d’autres langages .NET.
Ils peuvent réduire considérablement le code standard par rapport au code qui s'efforce d'éviter les exceptions en implémentant certains sous-ensembles de leur sémantique sur une base ad hoc.

Ce troisième point est essentiel. Pour les opérations complexes non-triviales, le fait de ne pas utiliser d’exceptions peut entraîner le traitement de structures telles que celles-ci :

Result<Result<MyType, string>, string list>

Ce qui peut facilement conduire à un code fragile, comme la correspondance de motifs sur des erreurs « faiblement typées par des chaînes » :

let result = doStuff()
match result with
| Ok r -> ...
| Error e ->
    if e.Contains "Error string 1" then ...
    elif e.Contains "Error string 2" then ...
    else ... // Who knows?

En outre, il peut être tentant d’accepter toute exception dans le désir d’une fonction « simple » qui retourne un type plus « agréable » :

// Can be problematic due to discarding the cause of error.
let tryReadAllText (path : string) =
    try System.IO.File.ReadAllText path |> Some
    with _ -> None

Malheureusement, tryReadAllText peut lever de nombreuses exceptions en fonction de la myriade de choses qui peuvent se produire sur un système de fichiers, et ce code ignore toutes les informations sur ce qui peut réellement se passer dans votre environnement. Si vous remplacez ce code par un type de résultat, vous revenez à l’analyse des messages d’erreur « typée par chaîne » :

// Problematic, callers only have a string to figure the cause of error.
let tryReadAllText (path : string) =
    try System.IO.File.ReadAllText path |> Ok
    with e -> Error e.Message

let r = tryReadAllText "path-to-file"
match r with
| Ok text -> ...
| Error e ->
    if e.Contains "uh oh, here we go again..." then ...
    else ...

De plus, le fait de placer l’objet d’exception lui-même dans le constructeur Error vous oblige simplement à traiter correctement le type d’exception sur le site d’appel plutôt que dans la fonction. Cela crée efficacement des exceptions vérifiées, qui sont notoirement peu agréables à traiter en tant qu’appelant d’une API.

Une bonne alternative aux exemples ci-dessus consiste à intercepter des exceptions spécifiques et à retourner une valeur significative dans le contexte de cette exception. Si vous modifiez la fonction tryReadAllText comme suit, None a plus de signification :

let tryReadAllTextIfPresent (path : string) =
    try System.IO.File.ReadAllText path |> Some
    with :? FileNotFoundException -> None

Au lieu de fonctionner comme un fourre-tout, cette fonction va maintenant gérer correctement le cas où un fichier n’a pas été trouvé et affecter cette signification à un retour. Cette valeur de retour peut correspondre à ce cas d’erreur, sans ignorer les informations contextuelles ou forcer les appelants à traiter un cas qui peut ne pas être pertinent à ce stade du code.

Les types tels que Result<'Success, 'Error> sont appropriés pour les opérations de base où ils ne sont pas imbriqués, et les types facultatifs F# sont parfaits pour représenter quand un élément peut retourner quelque chose ou rien. Toutefois, ils ne remplacent pas les exceptions et ne doivent pas être utilisés dans une tentative de remplacement d’exceptions. Au lieu de cela, ils doivent être appliqués judicieusement pour traiter des aspects spécifiques de la stratégie de gestion des exceptions et des erreurs de manière ciblée.

Application partielle et programmation sans point

F# prend en charge l'application partielle et, donc, différentes façons de programmer dans un style sans point. Cela peut être utile pour la réutilisation du code dans un module ou l’implémentation d’un élément, mais il ne s’agit pas d’un élément à exposer publiquement. En général, la programmation sans point n’est pas une vertu en soi, et peut ajouter une barrière cognitive significative pour les personnes qui ne sont pas immergées dans le style.

Ne pas utiliser l'application partielle et la currification dans les API publiques

À quelques exceptions près, l’utilisation d’une application partielle dans les API publiques peut prêter à confusion pour les consommateurs. En règle générale, les valeurs liées par let dans le code F# sont des valeurs, et non des valeurs de fonction. Le mélange de valeurs et de valeurs de fonction peut permettre d’économiser quelques lignes de code en échange d’un certain temps de surcharge cognitive, en particulier s’il est combiné avec des opérateurs tels que >> pour composer des fonctions.

Tenir compte des implications en matière d’outils pour la programmation sans point.

Les fonctions de corroyage n’étiquettent pas leurs arguments. Cela a des implications sur les outils. Considérons les deux fonctions suivantes :

let func name age =
    printfn $"My name is {name} and I am %d{age} years old!"

let funcWithApplication =
    printfn "My name is %s and I am %d years old!"

Les deux sont des fonctions valides, mais funcWithApplication est une fonction curryfiée. Lorsque vous pointez sur leurs types dans un éditeur, vous voyez ceci :

val func : name:string -> age:int -> unit

val funcWithApplication : (string -> int -> unit)

Au point d'appel, les info-bulles des outils tels que Visual Studio vous fourniront la signature de type, mais comme il n'y a pas de noms définis, ils n'afficheront pas de noms. Les noms sont essentiels à une bonne conception de l’API, car ils aident les appelants à mieux comprendre la signification de l’API. L’utilisation de code en style point-free dans l’API publique peut rendre la compréhension plus difficile pour les utilisateurs.

Si vous rencontrez du code sans point comme funcWithApplication qui est publiquement consommable, il est recommandé d’effectuer une expansion η complète afin que les outils puissent identifier des noms pertinents pour les arguments.

En outre, le débogage du code sans point peut être difficile, voire impossible. Les outils de débogage s’appuient sur des valeurs liées à des noms (par exemple, liaisons let) afin que vous puissiez inspecter les valeurs intermédiaires à mi-chemin de l’exécution. Lorsque votre code n’a aucune valeur à inspecter, il n’y a rien à déboguer. À l’avenir, les outils de débogage peuvent évoluer pour synthétiser ces valeurs en fonction de chemins d’accès précédemment exécutés, mais il n’est pas judicieux de parier sur les fonctionnalités de débogage potentielles.

Considérez l’application partielle comme une technique pour réduire le code standard interne.

Contrairement au point précédent, l’application partielle est un outil merveilleux pour réduire le code standard à l’intérieur d’une application ou des parties internes plus profondes d'une API. Il peut être utile pour tester unitairement l’implémentation d’API plus complexes, où le code standard est souvent laborieux à gérer. Par exemple, le code suivant montre comment vous pouvez accomplir ce que vous offrent la plupart des infrastructures fictives sans avoir à prendre une dépendance externe sur une telle infrastructure et à avoir à apprendre une API personnalisée associée.

Observez par exemple la topographie de la solution suivante :

MySolution.sln
|_/ImplementationLogic.fsproj
|_/ImplementationLogic.Tests.fsproj
|_/API.fsproj

ImplementationLogic.fsproj peut exposer du code tel que :

module Transactions =
    let doTransaction txnContext txnType balance =
        ...

type Transactor(ctx, currentBalance) =
    member _.ExecuteTransaction(txnType) =
        Transactions.doTransaction ctx txnType currentBalance
        ...

Les tests unitaires Transactions.doTransaction dans ImplementationLogic.Tests.fsproj sont faciles :

namespace TransactionsTestingUtil

open Transactions

module TransactionsTestable =
    let getTestableTransactionRoutine mockContext = Transactions.doTransaction mockContext

L’application partielle de doTransaction avec un objet de contexte fictif vous permet d’appeler la fonction dans tous vos tests unitaires sans avoir à construire un contexte fictif à chaque fois :

module TransactionTests

open Xunit
open TransactionTypes
open TransactionsTestingUtil
open TransactionsTestingUtil.TransactionsTestable

let testableContext =
    { new ITransactionContext with
        member _.TheFirstMember() = ...
        member _.TheSecondMember() = ... }

let transactionRoutine = getTestableTransactionRoutine testableContext

[<Fact>]
let ``Test withdrawal transaction with 0.0 for balance``() =
    let expected = ...
    let actual = transactionRoutine TransactionType.Withdraw 0.0
    Assert.Equal(expected, actual)

N’appliquez pas cette technique de manière universelle à l’ensemble de votre codebase, mais il s’agit d’un bon moyen de réduire la réutilisation pour les éléments internes complexes et les tests unitaires de ces éléments internes.

Contrôle d’accès

F# dispose de plusieurs options pour le contrôle d’accès, héritées de ce qui est disponible dans le runtime .NET. Elles ne sont pas seulement utilisables pour les types, vous pouvez également les utiliser pour les fonctions.

Bonnes pratiques dans le contexte des bibliothèques largement utilisées :

Préférez les types et les membres non-public jusqu’à ce que vous ayez besoin qu’ils puissent être utilisés publiquement. Cela réduit également les connexions auxquelles les consommateurs se lient.
Efforcez-vous de conserver toutes les fonctionnalités d’assistance private.
Envisagez l’utilisation de [<AutoOpen>] sur un module privé de fonctions d’assistance si elles deviennent nombreuses.

Inférence de type et génériques

L’inférence de type peut vous éviter de taper beaucoup de code standard. De plus, la généralisation automatique dans le compilateur F# peut vous aider à écrire du code plus générique sans presque aucun effort supplémentaire de votre part. Toutefois, ces fonctionnalités ne sont pas universellement bonnes.

Envisagez d’étiqueter des noms d’arguments avec des types explicites dans des API publiques et ne comptez pas sur l’inférence de type pour cela.

La raison en est que vous devez contrôler la forme de votre API, et non le compilateur. Bien que le compilateur puisse faire un bon travail pour déduire des types pour vous, il est possible que la forme de votre API change si les types internes sur lesquels elle s’appuie ont changé de type. C’est peut-être ce que vous voulez, mais cela entraînera presque certainement une modification d’API incompatible que les consommateurs de l'API devront ensuite gérer. Au lieu de cela, si vous contrôlez explicitement la forme de votre API publique, vous pouvez contrôler ces modifications de rupture. En termes de DDD, cela peut être considéré comme une couche anti-corruption.
Envisagez de donner un nom explicite à vos arguments génériques.

Sauf si vous écrivez du code vraiment générique qui n’est pas spécifique à un domaine particulier, un nom explicite peut aider d’autres programmeurs à comprendre le domaine dans lequel ils travaillent. Par exemple, un paramètre de type nommé 'Document dans le contexte de l’interaction avec une base de données de documents rend plus clair que les types de documents génériques peuvent être acceptés par la fonction ou le membre avec lequel vous travaillez.
Envisagez de nommer des paramètres de type génériques avec PascalCase.

Il s’agit de la façon générale de procéder dans .NET. Il est donc recommandé d’utiliser PascalCase plutôt que snake_case ou camelCase.

Enfin, la généralisation automatique n’est pas toujours une aubaine pour les personnes qui débutent avec F# ou disposent d’une codebase volumineuse. L’utilisation de composants génériques entraîne une surcharge cognitive. En outre, si les fonctions généralisées automatiquement ne sont pas utilisées avec différents types d’entrée (et encore moins si elles sont destinées à être utilisées en tant que telles), il n’y a aucun avantage réel à ce qu’elles soient génériques. Déterminez toujours si le code que vous écrivez bénéficiera réellement d’être générique.

Performance

Envisagez des structures pour les petits types avec des taux d’allocation élevés

L’utilisation de structs (également appelés types de valeurs) peut souvent entraîner des performances plus élevées pour certains codes, car cela évite généralement l’allocation d’objets. Toutefois, les structs ne constituent pas toujours un raccourci : si la taille des données d’un struct dépasse 16 octets, la copie des données peut souvent entraîner plus de temps de processeur que l’utilisation d’un type de référence.

Pour déterminer si vous devez utiliser un struct, tenez compte des conditions suivantes :

La taille de vos données est égale ou inférieure à 16 octets.
Il est probable que vous ayez de nombreuses instances de ces types résidant dans la mémoire lorsqu’un programme est en cours d’exécution.

Si la première condition s’applique, vous devez généralement utiliser un struct. Si les deux s’appliquent, vous devez presque toujours utiliser un struct. Il peut y avoir des cas où les conditions précédentes s’appliquent, mais l’utilisation d’un struct n’est pas meilleure ou pire que l’utilisation d’un type de référence, mais elles sont susceptibles d’être rares. Cependant, il est important de toujours mesurer l’apport de changements comme celui-ci, et de ne pas fonctionner sur des hypothèses ou de l’intuition.

Envisager des tuples de struct lors du regroupement de types de valeur petits avec taux élevés d'allocation

Considérons les deux fonctions suivantes :

let rec runWithTuple t offset times =
    let offsetValues x y z offset =
        (x + offset, y + offset, z + offset)

    if times <= 0 then
        t
    else
        let (x, y, z) = t
        let r = offsetValues x y z offset
        runWithTuple r offset (times - 1)

let rec runWithStructTuple t offset times =
    let offsetValues x y z offset =
        struct(x + offset, y + offset, z + offset)

    if times <= 0 then
        t
    else
        let struct(x, y, z) = t
        let r = offsetValues x y z offset
        runWithStructTuple r offset (times - 1)

Lorsque vous évaluez ces fonctions avec un outil d’évaluation statistique comme BenchmarkDotNet, vous constaterez que la fonction runWithStructTuple qui utilise des tuples de struct s’exécute 40 % plus rapidement et n’alloue aucune mémoire.

Toutefois, ces résultats ne seront pas toujours le cas dans votre propre code. Si vous marquez une fonction comme inline, le code qui utilise des tuples de référence peut obtenir des optimisations supplémentaires, ou le code à allouer peut simplement être optimisé. Vous devez toujours mesurer les résultats chaque fois que les performances sont concernées, et ne jamais agir en fonction de l’hypothèse ou de l’intuition.

Envisager les enregistrements de struct lorsque le type est petit et a des taux d’allocation élevés

La règle de base décrite précédemment est également valable pour les types d’enregistrements F#. Considérez les types de données et les fonctions suivants qui les traitent :

type Point = { X: float; Y: float; Z: float }

[<Struct>]
type SPoint = { X: float; Y: float; Z: float }

let rec processPoint (p: Point) offset times =
    let inline offsetValues (p: Point) offset =
        { p with X = p.X + offset; Y = p.Y + offset; Z = p.Z + offset }

    if times <= 0 then
        p
    else
        let r = offsetValues p offset
        processPoint r offset (times - 1)

let rec processStructPoint (p: SPoint) offset times =
    let inline offsetValues (p: SPoint) offset =
        { p with X = p.X + offset; Y = p.Y + offset; Z = p.Z + offset }

    if times <= 0 then
        p
    else
        let r = offsetValues p offset
        processStructPoint r offset (times - 1)

Cela est similaire au code tuple précédent, mais cette fois, l’exemple utilise des enregistrements et une fonction interne incorporée.

Lorsque vous évaluez ces fonctions avec un outil d’évaluation statistique comme BenchmarkDotNet, vous constaterez que processStructPoint s’exécute presque 60 % plus rapidement et n’alloue rien sur le tas géré.

Envisagez les unions de type struct discriminées lorsque le type de données est petit avec des taux d’allocation élevés.

Les observations précédentes sur les performances avec des tuples de struct et des enregistrements sont également valables pour les unions discriminées F#. Prenez le code suivant :

    type Name = Name of string

    [<Struct>]
    type SName = SName of string

    let reverseName (Name s) =
        s.ToCharArray()
        |> Array.rev
        |> System.String
        |> Name

    let structReverseName (SName s) =
        s.ToCharArray()
        |> Array.rev
        |> System.String
        |> SName

Il est courant de définir des unions discriminées à cas unique comme ceci pour la modélisation de domaine. Lorsque vous évaluez ces fonctions avec un outil d’évaluation statistique comme BenchmarkDotNet, vous constaterez que structReverseName s’exécute environ 25 % plus rapidement que reverseName pour les petites chaînes. Pour les chaînes volumineuses, les deux fonctionnent à peu près de la même façon. Donc, dans ce cas, il est toujours préférable d’utiliser un struct. Comme mentionné précédemment, mesurez toujours et n’agissez pas sur des hypothèses ou de l’intuition.

Bien que l’exemple précédent ait montré qu’une union discriminée de struct produisait de meilleures performances, il est courant d’avoir des unions discriminées plus grandes lors de la modélisation d’un domaine. Les types de données plus volumineux comme ceux-ci peuvent ne pas fonctionner aussi bien s’ils sont des structs en fonction des opérations effectuées sur eux, car il peut y avoir davantage de copie.

Immuabilité et mutation

Les valeurs F# sont immuables par défaut, ce qui vous permet d’éviter certaines classes de bogues (en particulier ceux impliquant la concurrence et le parallélisme). Toutefois, dans certains cas, pour obtenir une efficacité optimale (voire raisonnable) du temps d’exécution ou de l’allocation de mémoire, il est préférable d’implémenter une étendue de travail en utilisant une mutation d’état sur place. Cela est possible sur la base du consentement avec F# avec le mot clé mutable.

L’utilisation de mutable dans F# peut sembler en contradiction avec la pureté fonctionnelle. C’est compréhensible, mais la pureté fonctionnelle à tous les niveaux peut être en contradiction avec les objectifs de performance. Un compromis consiste à encapsuler la mutation de sorte que les appelants n’ont pas besoin de se soucier de ce qui se passe lorsqu’ils appellent une fonction. Cela vous permet d’écrire une interface de programmation fonctionnelle sur une implémentation basée sur une mutation pour du code dont les performances sont critiques.

En outre, la construction de liaison F# let permet d’imbriquer une liaison dans une autre, ce qui peut être exploité pour que la portée de la variable mutable soit aussi proche que possible ou au minimum théorique.

let data =
    [
        let mutable completed = false
        while not completed do
            logic ()
            // ...
            if someCondition then
                completed <- true
    ]

Aucun code ne peut accéder au mutable completed utilisé uniquement pour initialiser une valeur liée par "let" data.

Encapsuler le code mutable dans des interfaces immuables

Avec comme objectif la transparence référentielle, il est essentiel d’écrire du code qui n’expose pas le point vulnérable mutable des fonctions critiques pour les performances. Par exemple, le code suivant implémente la fonction Array.contains dans la bibliothèque principale F# :

[<CompiledName("Contains")>]
let inline contains value (array:'T[]) =
    checkNonNull "array" array
    let mutable state = false
    let mutable i = 0
    while not state && i < array.Length do
        state <- value = array[i]
        i <- i + 1
    state

L’appel de cette fonction plusieurs fois ne modifie pas le tableau sous-jacent et ne vous oblige pas à maintenir un état mutable lors de sa consommation. Elle est transparente d’un point de vue référentiel, même si presque toutes les lignes de code qu’elle contient utilisent une mutation.

Envisager d’encapsuler des données mutables dans des classes

L’exemple précédent utilisait une seule fonction pour encapsuler des opérations à l’aide de données mutables. Cela n’est pas toujours suffisant pour des jeux de données plus complexes. Considérez les ensembles de fonctions suivants :

open System.Collections.Generic

let addToClosureTable (key, value) (t: Dictionary<_,_>) =
    if t.ContainsKey(key) then
        t[key] <- value
    else
        t.Add(key, value)

let closureTableCount (t: Dictionary<_,_>) = t.Count

let closureTableContains (key, value) (t: Dictionary<_, HashSet<_>>) =
    match t.TryGetValue(key) with
    | (true, v) -> v.Equals(value)
    | (false, _) -> false

Ce code est performant, mais il expose la structure de données basée sur la mutation que les appelants sont chargés de gérer. Cela peut être encapsulé à l’intérieur d’une classe sans qu’aucun membre sous-jacent ne puisse changer :

open System.Collections.Generic

/// The results of computing the LALR(1) closure of an LR(0) kernel
type Closure1Table() =
    let t = Dictionary<Item0, HashSet<TerminalIndex>>()

    member _.Add(key, value) =
        if t.ContainsKey(key) then
            t[key] <- value
        else
            t.Add(key, value)

    member _.Count = t.Count

    member _.Contains(key, value) =
        match t.TryGetValue(key) with
        | (true, v) -> v.Equals(value)
        | (false, _) -> false

Closure1Table encapsule la structure de données basée sur la mutation sous-jacente, ce qui ne force pas les appelants à maintenir la structure de données sous-jacente. Les classes constituent un moyen puissant d’encapsuler des données et des routines basées sur des mutations sans exposer les détails aux appelants.

Préférer `let mutable` à `ref`

Les cellules de référence sont un moyen de représenter la référence à une valeur plutôt que la valeur elle-même. Bien qu’elles puissent être utilisées pour du code critique pour les performances, elles ne sont pas recommandées. Prenons l’exemple suivant :

let kernels =
    let acc = ref Set.empty

    processWorkList startKernels (fun kernel ->
        if not ((!acc).Contains(kernel)) then
            acc := (!acc).Add(kernel)
        ...)

    !acc |> Seq.toList

L’utilisation d’une cellule de référence « pollue » désormais tout le code suivant et doit déréférencer et référencer à nouveau les données sous-jacentes. Envisagez plutôt let mutable :

let kernels =
    let mutable acc = Set.empty

    processWorkList startKernels (fun kernel ->
        if not (acc.Contains(kernel)) then
            acc <- acc.Add(kernel)
        ...)

    acc |> Seq.toList

Mis à part le point de mutation unique au milieu de l’expression lambda, tout autre code qui touche acc peut le faire d’une manière qui n’est pas différente de l’utilisation d’une valeur immuable normale liée à let. Cela facilitera les modifications au fil du temps.

Valeurs nulles et valeurs par défaut

Les valeurs nulles doivent généralement être évitées dans F#. Par défaut, les types déclarés par F# ne prennent pas en charge l’utilisation du null littéral, et toutes les valeurs et objets sont initialisés. Toutefois, certaines API .NET courantes retournent ou acceptent des valeurs nulles, et d’autres types déclarés .NET courants, tels que les tableaux et les chaînes, autorisent les valeurs nulles. Toutefois, l’occurrence de valeurs null est très rare dans la programmation F# et l’un des avantages de l’utilisation de F# est d’éviter les erreurs de référence nulle dans la plupart des cas.

Éviter l’utilisation de l’attribut `AllowNullLiteral`

Par défaut, les types déclarés par F# ne prennent pas en charge l’utilisation du littéral null. Vous pouvez annoter manuellement les types F# avec AllowNullLiteral pour autoriser cette opération. Cependant, il est presque toujours préférable d’éviter cela.

Éviter l’utilisation de l’attribut `Unchecked.defaultof<_>`

Il est possible de générer une valeur null ou une valeur initialisée par zéro pour un type F# à l’aide de Unchecked.defaultof<_>. Cela peut être utile lors de l’initialisation du stockage pour certaines structures de données, dans un modèle de codage de haute performance ou dans l’interopérabilité. Toutefois, l’utilisation de cette construction doit être évitée.

Éviter l’utilisation de l’attribut `DefaultValue`

Par défaut, les enregistrements et objets F# doivent être correctement initialisés lors de la construction. L’attribut DefaultValue peut être utilisé pour remplir certains champs d’objets avec une valeur null ou une valeur initialisée par zéro. Cette construction est rarement nécessaire et son utilisation doit être évitée.

Si vous vérifiez les entrées nulles, déclenchez des exceptions dès que possible

Lors de l’écriture d’un nouveau code F#, dans la pratique, il n’est pas nécessaire de rechercher des entrées nulles, sauf si vous vous attendez à ce que le code soit utilisé à partir de C# ou d’autres langages .NET.

Si vous décidez d’ajouter des vérifications pour les entrées nulles, effectuez les vérifications à la première occasion et déclenchez une exception. Par exemple :

let inline checkNonNull argName arg =
    if isNull arg then
        nullArg argName

module Array =
    let contains value (array:'T[]) =
        checkNonNull "array" array
        let mutable result = false
        let mutable i = 0
        while not state && i < array.Length do
            result <- value = array[i]
            i <- i + 1
        result

Pour des raisons héritées, certaines fonctions de chaîne dans FSharp.Core traitent toujours les valeurs nulles comme des chaînes vides et n’échouent pas sur les arguments nuls. Toutefois, n’envisagez pas cela comme des conseils et n’adoptez pas de modèles de codage qui attribuent une signification sémantique à « nul ».

Tirer parti de la syntaxe null F# 9 aux limites de l’API

F# 9 ajoute syntaxe pour indiquer explicitement qu’une valeur peut être nulle. Il est conçu pour être utilisé sur les limites de l’API pour que le compilateur indique les emplacements où la gestion null est manquante.

Voici un exemple d’utilisation valide de la syntaxe :

type CustomType(m1, m2) =
    member _.M1 = m1
    member _.M2 = m2

    override this.Equals(obj: obj | null) =
        match obj with
        | :? CustomType as other -> this.M1 = other.M1 && this.M2 = other.M2
        | _ -> false

    override this.GetHashCode() =
        hash (this.M1, this.M2)

Évitez propager des valeurs Null plus bas dans votre code F# :

let getLineFromStream (stream: System.IO.StreamReader) : string | null =
    stream.ReadLine()

Au lieu de cela, utilisez les moyens F# idiomatiques (par exemple, les options) :

let getLineFromStream (stream: System.IO.StreamReader) =
    stream.ReadLine() |> Option.ofObj

Pour déclencher des exceptions liées à null, vous pouvez utiliser des fonctions nullArgCheck et nonNull spéciales. Ils sont également pratiques, car dans le cas où la valeur n’est pas nulle, ils masquent l’argument avec sa valeur purifiée - le code suivant ne peut plus accéder aux pointeurs nuls possibles.

let inline processNullableList list =
   let list = nullArgCheck (nameof list) list   // throws `ArgumentNullException`
   // 'list' is safe to use from now on
   list |> List.distinct

let inline processNullableList' list =
    let list = nonNull list                     // throws `NullReferenceException`
    // 'list' is safe to use from now on
    list |> List.distinct

Programmation d’objets

F# prend entièrement en charge les objets et les concepts orientés objet. Bien que de nombreux concepts orientés objet soient puissants et utiles, ils ne sont pas tous idéaux à utiliser. Les listes suivantes offrent des conseils sur les catégories de fonctionnalités orientées objet à un niveau supérieur.

Envisagez d’utiliser ces fonctionnalités dans de nombreuses situations :

Notation par points (x.Length)
Membres d’instance
Constructeurs implicites
Membres statiques
Notation de l’indexeur (arr[x]), en définissant une propriété Item
Notation de découpage (arr[x..y], arr[x..], arr[..y]), en définissant des membres GetSlice
Arguments nommés et facultatifs
Interfaces et implémentations d’interface

Ne commencez pas par utiliser ces fonctionnalités, mais appliquez-les judicieusement lorsqu’elles sont pratiques pour résoudre un problème :

Surcharge de méthode
Données mutables encapsulées
Opérateurs sur les types
Propriétés automatiques
Implémentation de IDisposable et IEnumerable
Extensions de type
Événements
Structures
Délégués
Énumérations

De manière générale, évitez ces fonctionnalités, sauf si vous devez les utiliser :

Hiérarchies de types basées sur l’héritage et héritage d’implémentation
Nuls et Unchecked.defaultof<_>

Préférer la composition à l’héritage

La composition sur l’héritage est un langage de longue date auquel un bon code F# peut adhérer. Le principe fondamental est que vous ne devez pas exposer une classe de base et forcer les appelants à hériter de cette classe de base pour obtenir des fonctionnalités.

Utiliser des expressions d’objet pour implémenter des interfaces si vous n’avez pas besoin d’une classe

Les expressions d’objet vous permettent d’implémenter des interfaces à la volée, en liant l’interface implémentée à une valeur sans avoir à le faire à l’intérieur d’une classe. Cela est pratique, en particulier si vous avez uniquement besoin d’implémenter l’interface et que vous n’avez pas besoin d’une classe complète.

Par exemple, voici le code exécuté dans Ionide pour fournir une action de correction de code si vous avez ajouté un symbole pour lequel vous n’avez pas d’instruction open :

    let private createProvider () =
        { new CodeActionProvider with
            member this.provideCodeActions(doc, range, context, ct) =
                let diagnostics = context.diagnostics
                let diagnostic = diagnostics |> Seq.tryFind (fun d -> d.message.Contains "Unused open statement")
                let res =
                    match diagnostic with
                    | None -> [||]
                    | Some d ->
                        let line = doc.lineAt d.range.start.line
                        let cmd = createEmpty<Command>
                        cmd.title <- "Remove unused open"
                        cmd.command <- "fsharp.unusedOpenFix"
                        cmd.arguments <- Some ([| doc |> unbox; line.range |> unbox; |] |> ResizeArray)
                        [|cmd |]
                res
                |> ResizeArray
                |> U2.Case1
        }

Étant donné qu’il n’est pas nécessaire d’utiliser une classe lors de l’interaction avec l’API Visual Studio Code, les expressions d’objet sont un outil idéal pour cela. Elles sont également utiles pour les tests unitaires, lorsque vous souhaitez extraire une interface avec des routines de test de manière improvisée.

Envisager des abréviations de type pour raccourcir les signatures

Les abréviations de type sont un moyen pratique d’affecter une étiquette à un autre type, tel qu’une signature de fonction ou un type plus complexe. Par exemple, l’alias suivant attribue une étiquette à ce qui est nécessaire pour définir un calcul avec CNTK, une bibliothèque deep learning :

open CNTK

// DeviceDescriptor, Variable, and Function all come from CNTK
type Computation = DeviceDescriptor -> Variable -> Function

Le nom Computation est un moyen pratique de désigner toute fonction qui correspond à la signature à laquelle est attribué un alias. L’utilisation d’abréviations de type comme celle-ci est pratique et permet d’obtenir du code plus succinct.

Éviter d’utiliser des abréviations de type pour représenter votre domaine

Bien que les abréviations de type soient pratiques pour donner un nom aux signatures de fonction, elles peuvent prêter à confusion lors de l’abréviation d’autres types. Considérez cette abréviation :

// Does not actually abstract integers.
type BufferSize = int

Cela peut prêter à confusion pour plusieurs raisons :

BufferSize n’est pas une abstraction. Il s’agit simplement d’un autre nom pour un entier.
Si BufferSize est exposé dans une API publique, il peut facilement être mal interprété pour signifier plus que juste int. En règle générale, les types de domaine ont plusieurs attributs et ne sont pas des types primitifs comme int. Cette abréviation contrevient à cette hypothèse.
La casse de BufferSize (PascalCase) implique que ce type est destiné à contenir plus de données.
Cet alias n’offre pas davantage de clarté par rapport à la fourniture d’un argument nommé à une fonction.
L’abréviation ne se manifeste pas dans le langage intermédiaire compilé. Il s’agit simplement d’un entier et cet alias est une construction au moment de la compilation.

module Networking =
    ...
    let send data (bufferSize: int) = ...

En résumé, le piège des abréviations de type est qu’il ne s’agit pas d’abstractions sur les types qu’elles raccourcissent. Dans l’exemple précédent, BufferSize est juste un int sous-couvert, sans données supplémentaires, ni avantages du système de type en plus de ce que int a déjà.

Une autre approche pour utiliser des abréviations de type pour représenter un domaine consiste à utiliser des unions discriminées à cas unique. L’exemple précédent peut être modélisé comme suit :

type BufferSize = BufferSize of int

Si vous écrivez du code qui fonctionne en termes de BufferSize et sa valeur sous-jacente, vous devez en construire un au lieu de passer n’importe quel entier arbitraire :

module Networking =
    ...
    let send data (BufferSize size) =
    ...

Cela réduit la probabilité de passer par erreur un entier arbitraire dans la fonction send, car l’appelant doit construire un type BufferSize pour encapsuler une valeur avant d’appeler la fonction.

Commentaires

Est-ce que cette page vous a été utile?

Last updated on 2023-05-10