Incompatibilité entre types SQL-CLR

Article
05/09/2023

LINQ to SQL automatise en grande partie la traduction entre le modèle objet et SQL Server. Certaines situations ne permettent toutefois pas une traduction exacte. Cette incompatibilité majeure entre les types CLR (Common Language Runtime) et les types de base de données SQL Server est résumée dans les sections suivantes. Pour plus d’informations sur les mappages de types et la traduction de fonctions spécifiques, consultez Mappage de type SQL-CLR et Fonctions et types de données.

Types de données

La traduction entre CLR et SQL Server se produit lorsqu'une requête est envoyée à la base de données, et lorsque les résultats sont renvoyés au modèle objet. Par exemple, la requête Transact-SQL suivante requiert deux conversions de valeurs :

Select DateOfBirth From Customer Where CustomerId = @id

Pour que la requête soit exécutée sur SQL Server, vous devez spécifier la valeur du paramètre Transact-SQL. Dans cet exemple, la valeur du paramètre id doit d'abord être traduite d'un type System.Int32 CLR en un type INT SQL Server afin que la base de données puisse comprendre en quoi consiste cette valeur. Puis pour récupérer les résultats, la colonne DateOfBirth SQL Server doit être traduite d'un type DATETIME SQL Server en un type System.DateTime CLR à des fins d'utilisation dans le modèle objet. Dans cet exemple, les types du modèle objet CLR et de la base de données SQL Server ont des mappages naturels. Mais ce n'est pas toujours le cas.

Équivalents manquants

Les types suivants n'ont pas d'équivalents raisonnables.

Incompatibilités dans l'espace de noms System CLR :
- Entiers non signés. Ces types sont généralement mappés à leurs équivalents signés de plus grande taille pour éviter le dépassement de capacité. Les littéraux peuvent être convertis en numérique signé de taille équivalente ou inférieure, selon la valeur.
- Boolean. Ces types peuvent être mappés à un bit ou à un numérique ou une chaîne de taille supérieure. Un littéral peut être mappé à une expression qui correspond à la même valeur (par exemple, 1=1 dans SQL pour True dans CLS).
- TimeSpan. Ce type représente la différence entre deux valeurs DateTime et ne correspond pas au timestamp de SQL Server. Dans certains cas, le System.TimeSpan CLR peut également mapper au type TIME SQL Server. Le type TIME SQL Server a pour but de représenter les valeurs positives inférieures à 24 heures. Le TimeSpan CLR offre une plage beaucoup plus étendue.
Notes

Les types .NET Framework spécifiques à SQL Server dans System.Data.SqlTypes ne sont pas inclus dans cette comparaison.
Incompatibilités dans SQL Server :
- Types de caractères de longueur fixe. Transact-SQL fait la distinction entre les catégories Unicode et non Unicode et possède trois types distincts dans chaque catégorie : nchar/char de longueur fixe, nvarchar/varchar de longueur variable et ntext/text de taille supérieure. Les types de caractères de longueur fixe peuvent être mappés au type System.Char CLR pour récupérer des caractères, mais ils ne correspondent pas vraiment au même type dans les conversions et le comportement.
- Bit. Bien que le domaine bit présente le même nombre de valeurs que Nullable<Boolean>, il s'agit de deux types différents. Bit prend les valeurs 1 et 0 au lieu de true/false et ne peut pas être utilisé comme un équivalent aux expressions booléennes.
- Timestamp. Contrairement au type System.TimeSpan CLR, le type TIMESTAMP SQL Server représente un nombre de 8 octets généré par la base de données qui est unique pour chaque mise à jour et n'est pas basé sur la différence entre des valeurs DateTime.
- Money et SmallMoney. Ces types peuvent être mappés à Decimal mais ils sont fondamentalement différents et sont traités comme tels par les fonctions et les conversions serveur.

Mappages multiples

Il existe également de nombreux types de données SQL Server que vous pouvez mapper à un ou plusieurs types de données CLR. Il existe également de nombreux types CLR que vous pouvez mapper à un ou plusieurs types SQL Server. Même si un mappage est pris en charge par LINQ to SQL, cela n'implique pas nécessairement que deux types mappés entre CLR et SQL Server présenteront une précision, une plage et une sémantique identiques. Certains mappages peuvent inclure des différences au niveau de tout ou partie de ces trois aspects. Pour plus d’informations sur ces différences éventuelles pour les diverses possibilités de mappage, consultez Mappage de type SQL-CLR.

Types définis par l'utilisateur

Les types CLR définis par l'utilisateur sont conçus pour aider à combler le fossé entre les systèmes de types. Ils présentent néanmoins des problèmes intéressants concernant le versioning de type. Une modification de la version du client peut ne pas avoir de modification correspondante dans le type stocké sur le serveur de base de données. Toute modification de ce type entraîne une autre incompatibilité de type où la sémantique de type risque de ne pas correspondre et la différence de version peut devenir visible. D'autres complications interviennent puisque les hiérarchies d'héritage sont refactorisées dans les versions successives.

Sémantique d'expression

Outre l'incompatibilité par paire entre les types CLR et de base de données, les expressions compliquent l'incompatibilité. Les incompatibilités dans la sémantique d'opérateur, la sémantique de fonction, la conversion de type implicite et les règles de priorité doivent être prises en compte.

Les sous-sections suivantes illustrent l'incompatibilité entre des expressions apparemment similaires. Il est possible de générer des expressions SQL qui sont sémantiquement équivalentes à une expression CLR donnée. Toutefois, on ne peut pas déterminer avec précision si les différences sémantiques entre des expressions apparemment similaires sont évidentes pour un utilisateur CLR, et par conséquent si les modifications requises pour l'équivalence sémantique sont prévues ou non. Un problème particulièrement critique se pose lors de l'évaluation d'une expression pour un ensemble de valeurs. La visibilité de la différence peut dépendre des données et être difficile à identifier pendant le codage et le débogage.

Sémantique Null

Les expressions SQL fournissent la logique à trois valeurs pour les expressions booléennes. Le résultat peut être true, false ou null. CLR spécifie un résultat booléen à deux valeurs pour les comparaisons impliquant des valeurs null. Prenez le code suivant :

Nullable<int> i = null;
Nullable<int> j = null;
if (i == j)
{
    // This branch is executed.
}

Dim i? As Integer = Nothing
Dim j? As Integer = Nothing
If i = j Then
    '  This branch is executed.
End If

-- Assume col1 and col2 are integer columns with null values.
-- Assume that ANSI null behavior has not been explicitly
--  turned off.
Select …
From …
Where col1 = col2
-- Evaluates to null, not true and the corresponding row is not
--   selected.
-- To obtain matching behavior (i -> col1, j -> col2) change
--   the query to the following:
Select …
From …
Where
    col1 = col2
or (col1 is null and col2 is null)
-- (Visual Basic 'Nothing'.)

Un problème similaire se produit avec l'hypothèse concernant les résultats à deux valeurs.

if ((i == j) || (i != j)) // Redundant condition.
{
    // ...
}

If (i = j) Or (i <> j) Then ' Redundant condition.
    ' ...
End If

-- Assume col1 and col2 are nullable columns.
-- Assume that ANSI null behavior has not been explicitly
--   turned off.
Select …
From …
Where
    col1 = col2
or col1 != col2
-- Visual Basic: col1 <> col2.

-- Excludes the case where the boolean expression evaluates
--   to null. Therefore the where clause does not always
--   evaluate to true.

Dans le cas précédent, vous pouvez obtenir un comportement équivalent en générant du SQL, mais la traduction risque de ne pas refléter correctement votre intention.

LINQ to SQL n’impose pas la sémantique de comparaison C# null ou Visual Basic nothing sur SQL. Les opérateurs de comparaison sont traduits syntaxiquement dans leurs équivalents SQL. La sémantique reflète la sémantique SQL définie par les paramètres du serveur ou de la connexion. Deux valeurs null sont considérées comme différentes selon les paramètres SQL Server (bien que vous puissiez modifier les paramètres pour changer la sémantique). Quoi qu'il en soit, LINQ to SQL ne tient pas compte des paramètres du serveur lors de la traduction de requête.

Une comparaison avec le littéral null (nothing) est traduite dans la version SQL appropriée (is null ou is not null).

La valeur de null (nothing) dans le classement est définie par SQL Server et LINQ to SQL ne change pas le classement.

Conversion et promotion de type

SQL prend en charge un ensemble complet de conversions implicites d'expressions. Des expressions similaires en C# nécessiteraient un cast explicite. Par exemple :

Les types Nvarchar et DateTime peuvent être comparés dans SQL sans cast explicite mais C# nécessite une conversion explicite.
Decimal est converti implicitement en DateTime dans SQL. C# n'autorise pas de conversion implicite.

De même, la priorité des types de Transact-SQL diffère de celle de C# car l'ensemble de types sous-jacent est différent. En fait, il n'existe pas de relation sous-ensemble/sur-ensemble claire entre les listes de priorités. Par exemple, la comparaison d'un nvarchar avec un varchar entraîne la conversion implicite de l'expression varchar en nvarchar. CLR ne fournit aucune promotion équivalente.

Dans les cas simples, ces différences soumettent les expressions CLR à des casts redondants pour une expression SQL correspondante. Plus important, les résultats intermédiaires d'une expression SQL risquent de faire l'objet d'une promotion implicite en un type qui ne présente aucun équivalent exact en C# et inversement. De manière générale, le test, le débogage et la validation de ce type d'expressions représentent une charge de travail supplémentaire pour l'utilisateur.

Classement

Transact-SQL prend en charge des classements explicites tels que les annotations des types de chaînes de caractères. Ces classements déterminent la validité de certaines comparaisons. Par exemple, la comparaison de deux colonnes avec des classements explicites différents est une erreur. L'utilisation d'un type de chaîne CTS très simplifié ne provoque pas de telles erreurs. Prenons l’exemple suivant :

create table T2 (
    Col1 nvarchar(10),
    Col2      nvarchar(10) collate Latin_general_ci_as
)

class C
{
string s1;       // Map to T2.Col1.
string s2;       // Map to T2.Col2.

    void Compare()
    {
        if (s1 == s2) // This is correct.
        {
            // ...
        }
    }
}

Class C
    Dim s1 As String    ' Map to T2.Col1.
    Dim s2 As String    ' Map to T2.Col2.
    Sub Compare()
        If s1 = s2 Then ' This is correct.
            ' ...
        End If
    End Sub
End Class

Select …
From …
Where Col1 = Col2
-- Error, collation conflict.

En fait, la sous-clause de classement crée un type restreint qui n’est pas substituable.

De même, l'ordre de tri peut être considérablement différent selon les systèmes de type. Cette différence concerne le tri des résultats. Guid est trié sur les 16 octets dans l'ordre lexicographique (IComparable()), tandis que T-SQL compare les GUID dans l'ordre suivant : node(10-15), clock-seq(8-9), time-high(6-7), time-mid(4-5), time-low(0-3). Cette organisation a été définie dans SQL 7.0 lorsque les GUID générés par NT présentaient cet ordre d'octets. Cette approche a permis de s'assurer que les GUID générés sur le même cluster de nœuds se présentaient dans l'ordre séquentiel en fonction de l'horodatage. Elle s'est également avérée utile pour la génération d'index (les insertions deviennent des ajouts plutôt que des E/S aléatoires). L'ordre a été brouillé ultérieurement dans Windows en raison de problèmes de confidentialité, mais SQL doit maintenir la compatibilité. Pour résoudre ce problème, vous pouvez utiliser SqlGuid plutôt que Guid.

Différences d'opérateur et de fonction

Les opérateurs et les fonctions qui sont pour l'essentiel comparables ont une sémantique légèrement différente. Par exemple :

C# spécifie une sémantique de « court-circuit » selon l’ordre lexical des opérandes pour les opérateurs logiques && et ||. SQL est destiné aux requêtes basées sur des ensembles et laisse par conséquent une plus grande marge de manœuvre à l'optimiseur pour décider de l'ordre d'exécution. Les conséquences sont notamment les suivantes :
- Une traduction équivalente sur le plan sémantique nécessiterait une construction « CASE ... WHEN … THEN » dans SQL pour éviter de réorganiser l’exécution de l’opérande.
- Une traduction faible dans les opérateurs AND/OR pourrait entraîner des erreurs inattendues si l’expression C# repose sur l’évaluation du deuxième opérande basée sur le résultat de l’évaluation du premier opérande.
La sémantique de la fonction Round() est différente dans le .NET Framework et dans T-SQL.
L'index de départ des chaînes correspond à 0 dans CLR et à 1 dans SQL. Par conséquent, toute fonction comportant des index nécessite une traduction des index.
Contrairement à SQL, CLR prend en charge l'opérateur modulo (%) pour les nombres à virgule flottante.
L'opérateur Like acquiert efficacement des surcharges automatiques selon des conversions implicites. Bien que l'opérateur Like soit défini pour fonctionner sur des types de chaînes de caractères, la conversion implicite de types numériques ou types DateTime permet également l'utilisation de ces types non-chaînes avec Like. Dans CTS, il n'existe pas de conversion implicite comparable. Par conséquent, des surcharges supplémentaires sont nécessaires.

Notes

Ce comportement de l'opérateur Like s'applique uniquement à C# ; le mot clé Like de Visual Basic reste inchangé.
Le dépassement de capacité est toujours vérifié dans SQL mais il doit être spécifié explicitement dans C# (pas dans Visual Basic) pour éviter le bouclage. Considérons des colonnes d'entiers C1, C2 et C3, si C1+C2 est stocké dans C3 (Update T Set C3 = C1+C2).
```
create table T3 (
    Col1      integer,
    Col2      integer
)
insert into T3 (col1, col2) values (2147483647, 5)
-- Valid values: max integer value and 5.
select * from T3 where col1 + col2 < 0
-- Produces arithmetic overflow error.
```

// C# overflow in absence of explicit checks.
int i = Int32.MaxValue;
int j = 5;
if (i+j < 0) Console.WriteLine("Overflow!");
// This code prints the overflow message.

' Does not apply.
' Visual Basic overflow in absence of implicit check
' (turn off overflow checks in compiler options)
Dim I As Integer = Int32.MaxValue
Dim j As Integer = 5
If I + j < 0 Then
    ' This code prints the overflow message.
    Console.WriteLine("Overflow!")
End If

SQL effectue un arrondi arithmétique symétrique lorsque le .NET Framework utilise l’arrondi bancaire. Pour plus d'informations, consultez l'article 196652 de la Base de connaissances.
Par défaut, les comparaisons de chaînes de caractères ne sont pas sensibles à la casse dans SQL pour les paramètres régionaux communs. Dans Visual Basic et C#, elles sont sensibles à la casse. Par exemple, s == "Food" (s = "Food" dans Visual Basic) et s == "Food" peuvent générer des résultats différents si s est food.
```
-- Assume default US-English locale (case insensitive).
create table T4 (
    Col1      nvarchar (256)
)
insert into T4 values ('Food')
insert into T4 values ('FOOD')
select * from T4 where Col1 = 'food'
-- Both the rows are returned because of case-insensitive matching.
```

// C# equivalent on collections of Strings in place of nvarchars.
String[] strings = { "food", "FOOD" };
foreach (String s in strings)
{
    if (s == "food")
    {
        Console.WriteLine(s);
    }
}
// Only "food" is returned.

' Visual Basic equivalent on collections of Strings in place of
' nvarchars.
Dim strings() As String = {"food", "FOOD"}
For Each s As String In strings
    If s = "food" Then
        Console.WriteLine(s)
    End If
Next
' Only "food" is returned.

Les opérateurs/fonctions appliqués aux arguments de type de caractères de longueur fixe dans SQL ont une sémantique sensiblement différente par rapport aux mêmes opérateurs/fonctions appliqués à un objet System.String CLR. Cela peut également être considéré comme une extension du problème d’équivalents manquants abordé dans la section consacrée aux types.

create table T4 (
    Col1      nchar(4)
)
Insert into T5(Col1) values ('21');
Insert into T5(Col1) values ('1021');
Select * from T5 where Col1 like '%1'
-- Only the second row with Col1 = '1021' is returned.
-- Not the first row!

// Assume Like(String, String) method.
string s = ""; // map to T4.Col1
if (System.Data.Linq.SqlClient.SqlMethods.Like(s, "%1"))
{
    Console.WriteLine(s);
}
// Expected to return true for both "21" and "1021"

' Assume Like(String, String) method.
Dim s As String    ' Map to T4.Col1.
If s Like (System.Data.Linq.SqlClient.SqlMethods.Like(s, "%1")) Then
    Console.WriteLine(s)
End If
' Expected to return true for both "21" and "1021".

La concaténation de chaînes pose le même problème.

create table T6 (
    Col1      nchar(4)
    Col2       nchar(4)
)
Insert into T6 values ('a', 'b');
Select Col1+Col2 from T6
-- Returns concatenation of padded strings "a   b   " and not "ab".

En résumé, une traduction circonvolutionnée peut être requise pour les expressions CLR et des opérateurs/fonctions supplémentaires peuvent être nécessaires pour exposer les fonctionnalités SQL.

Cast de type

Dans C# et SQL, les utilisateurs peuvent substituer la sémantique par défaut d'expressions en utilisant des casts de types explicites (Cast et Convert). Toutefois, l'exposition de cette fonction sur la limite du système de type crée un dilemme. Un cast SQL qui fournit la sémantique souhaitée ne peut pas être traduit facilement en cast C# correspondant. Par contre, un cast C# ne peut pas être traduit directement en cast SQL équivalent en raison des incompatibilités de type, des équivalents manquants et des hiérarchies de priorité des types. Il existe un compromis entre l'exposition de l'incompatibilité du système de type et une perte importante de puissance d'expression.

Dans d’autres cas, le cast de type peut ne pas être nécessaire dans un domaine de validation d’une expression mais peut être requis pour s’assurer qu’un mappage non défini par défaut est appliqué correctement à l’expression.

-- Example from "Non-default Mapping" section extended
create table T5 (
    Col1      nvarchar(10),
    Col2      nvarchar(10)
)
Insert into T5(col1, col2) values ('3', '2');

class C
{
    int x;        // Map to T5.Col1.
    int y;        // Map to T5.Col2.

    void Casting()
    {
        // Intended predicate.
        if (x + y > 4)
        {
            // valid for the data above
        }
    }
}

Class C
    Dim x As Integer        ' Map to T5.Col1.
    Dim y As Integer        ' Map to T5.Col2.

    Sub Casting()
        ' Intended predicate.
        If (x + y) > 4 Then
            ' Valid for the data above.
        End If
    End Sub
End Class

Select *
From T5
Where Col1 + Col2 > 4
-- "Col1 + Col2" expr evaluates to '32'

Problèmes de performance

La prise en compte de certaines différences entre les types SQL Server et CLR peut entraîner une dégradation des performances lors du passage entre les systèmes de types CLR et SQL Server. Voici quelques exemples de scénarios affectant les performances :

Ordre d'évaluation de la logique et/ou des opérateurs forcé
La génération de SQL pour appliquer l'ordre d'évaluation des prédicats limite les capacités de l'optimiseur SQL.

Les conversions de type, qu'elles soient introduites par un compilateur CLR ou par une implémentation de requête objet-relationnel, peuvent réduire l'utilisation de l'index.

Par exemple,

-- Table DDL
create table T5 (
    Col1      varchar(100)
)

class C5
{
    string s;        // Map to T5.Col1.
}

Class C5
    Dim s As String ' Map to T5.Col1.
End Class

Prenons la traduction de l'expression (s = SOME_STRING_CONSTANT).

-- Corresponding part of SQL where clause
Where …
Col1 = SOME_STRING_CONSTANT
-- This expression is of the form <varchar> = <nvarchar>.
-- Hence SQL introduces a conversion from varchar to nvarchar,
--   resulting in
Where …
Convert(nvarchar(100), Col1) = SOME_STRING_CONSTANT
-- Cannot use the index for column Col1 for some implementations.

Outre les différences sémantiques, il est important de prendre en compte l'impact sur les performances lors du passage entre les systèmes de types SQL Server et CLR. Pour les grands groupes de données, de tels problèmes de performances peuvent déterminer si une application est déployable.

Voir aussi

Informations générales

Partager via