Réduire les problèmes SQL pour les migrations Netezza

Cet article fait partie cinq d’une série en sept parties qui fournit des conseils sur la migration de Netezza vers Azure Synapse Analytics. L’objectif de cet article est de réduire les problèmes SQL.

Aperçu

Caractéristiques des environnements Netezza

Conseil / Astuce

Netezza a lancé le concept d'« appliance d’entrepôt de données » au début des années 2000.

En 2003, Netezza a initialement publié son produit d’appliance d’entrepôt de données. Il a réduit le coût d’entrée et amélioré la facilité d’utilisation des techniques de traitement massivement parallèle (MPP) pour permettre le traitement des données à grande échelle plus efficacement que le mainframe existant ou d’autres technologies MPP disponibles au moment. Depuis lors, le produit a évolué et a de nombreuses installations parmi les grandes institutions financières, les télécommunications et les entreprises de vente au détail. L’implémentation d’origine utilisait du matériel propriétaire, y compris des circuits logiques programmables (ou FPGA), et était accessible via une connexion réseau ODBC ou JDBC sur TCP/IP.

La plupart des installations De Netezza existantes sont locales, de nombreux utilisateurs envisagent de migrer certaines ou toutes leurs données Netezza vers Azure Synapse Analytics pour bénéficier des avantages d’un déplacement vers un environnement cloud moderne.

Conseil / Astuce

De nombreuses installations Netezza existantes sont des entrepôts de données à l’aide d’un modèle de données dimensionnel.

La technologie Netezza est souvent utilisée pour implémenter un entrepôt de données, prenant en charge des requêtes analytiques complexes sur de grands volumes de données à l’aide de SQL. Les modèles de données dimensionnels (schémas en étoile ou en flocon) sont courants, tout comme l'utilisation de data marts pour chaque département.

Cette combinaison de modèles de données SQL et dimensionnels simplifie la migration vers Azure Synapse, car les concepts de base et les compétences SQL sont transférables. L’approche recommandée consiste à migrer le modèle de données existant as-is pour réduire les risques et le temps nécessaire. Même si l’intention éventuelle est d’apporter des modifications au modèle de données (par exemple, passer à un modèle de coffre de données), effectuez une migration initiale as-is, puis apportez des modifications dans l’environnement cloud Azure, en tirant parti des performances, de l’extensibilité élastique et des avantages économiques là-bas.

Bien que le langage SQL ait été normalisé, les fournisseurs individuels ont dans certains cas implémenté des extensions propriétaires. Ce document met en évidence les différences potentielles de SQL que vous pouvez rencontrer lors de la migration à partir d’un environnement Netezza hérité et fournit des solutions de contournement.

Implémentation d’une migration pilotée par les métadonnées avec Azure Data Factory

Conseil / Astuce

Automatisez le processus de migration à l’aide des fonctionnalités d’Azure Data Factory.

Automatisez et orchestrez le processus de migration en utilisant les fonctionnalités de l’environnement Azure. Cette approche réduit également l’impact de la migration sur l’environnement Netezza existant, qui peut déjà s’exécuter presque à pleine capacité.

Azure Data Factory est un service d’intégration de données basé sur le cloud qui permet la création de flux de travail pilotés par les données dans le cloud pour orchestrer et automatiser le déplacement et la transformation des données. À l’aide de Data Factory, vous pouvez créer et planifier des workflows pilotés par les données, appelés pipelines, qui peuvent ingérer des données à partir de magasins de données disparates. Il peut traiter et transformer des données à l’aide de services de calcul tels qu’Azure HDInsight Hadoop, Spark, Azure Data Lake Analytics et Azure Machine Learning.

En créant des métadonnées pour répertorier les tables de données à migrer et leur emplacement, vous pouvez utiliser les installations Data Factory pour gérer et automatiser des parties du processus de migration. Vous pouvez également utiliser Azure Synapse Pipelines.

Différences de DDL SQL entre Netezza et Azure Synapse

Langage de définition de données SQL (DDL)

Conseil / Astuce

Les commandes DDL SQL et CREATE TABLE ont des CREATE VIEW éléments de base standard, mais sont également utilisées pour définir des options spécifiques à l’implémentation.

La norme ANSI SQL définit la syntaxe de base pour les commandes DDL telles que CREATE TABLE et CREATE VIEW. Ces commandes sont utilisées dans Netezza et Azure Synapse, mais elles ont également été étendues pour permettre la définition de fonctionnalités spécifiques à l’implémentation, telles que l’indexation, la distribution de tables et les options de partitionnement.

Les sections suivantes décrivent les options spécifiques à Netezza à prendre en compte lors d’une migration vers Azure Synapse.

Considérations relatives aux tables

Conseil / Astuce

Utilisez des index existants pour indiquer les candidats à l’indexation dans l’entrepôt migré.

Lors de la migration de tables entre différentes technologies, seules les données brutes et ses métadonnées descriptives sont déplacées physiquement entre les deux environnements. D’autres éléments de base de données du système source, tels que les index et les fichiers journaux, ne sont pas directement migrés, car ils peuvent ne pas être nécessaires ou être implémentés différemment dans le nouvel environnement cible. Par exemple, l'option TEMPORARY dans la syntaxe CREATE TABLE de Netezza est équivalente à préfixer le nom de la table avec un caractère « # » dans Azure Synapse.

Il est important de comprendre où les optimisations des performances, telles que les index, ont été utilisées dans l’environnement source. Cela indique où l’optimisation des performances peut être ajoutée dans le nouvel environnement cible. Par exemple, si des cartes de zone ont été créées dans l’environnement Netezza source, cela peut indiquer qu’un index non-clusterisé devrait être créé dans la base de données Azure Synapse migrée. D’autres techniques d’optimisation des performances natives, telles que la réplication de table, peuvent être plus applicables qu’une création d’index « like-for-like » directe.

Types d’objets de base de données Netezza non pris en charge

Conseil / Astuce

Les fonctionnalités spécifiques à Netezza peuvent être remplacées par des fonctionnalités Azure Synapse.

Netezza implémente certains objets de base de données qui ne sont pas directement pris en charge dans Azure Synapse, mais il existe des méthodes pour obtenir les mêmes fonctionnalités dans le nouvel environnement :

Cartes de zone : dans Netezza, les mappages de zone sont créés et gérés automatiquement pour certains types de colonnes et sont utilisés au moment de la requête pour limiter la quantité de données à analyser. Les cartes de zones sont créées sur les types de colonnes suivants :
- INTEGER colonnes de longueur de 8 octets ou moins.
- Colonnes temporelles. Pour instance, DATE, TIMEet TIMESTAMP.
- CHAR colonnes, si elles font partie d’une vue matérialisée et mentionnées dans la ORDER BY clause.
Vous pouvez déterminer quelles colonnes ont des cartes de zone à l’aide de l’utilitaire nz_zonemap , qui fait partie du kit de ressources NZ. Azure Synapse n’inclut pas de mappages de zones, mais vous pouvez obtenir des résultats similaires à l’aide d’autres types d’index définis par l’utilisateur et/ou le partitionnement.
Tables de base en cluster (CBT) : dans Netezza, les CBT sont couramment utilisés pour les tables de faits, qui peuvent contenir des milliards d'enregistrements. L’analyse d’une telle table énorme nécessite beaucoup de temps de traitement, car une analyse complète de table peut être nécessaire pour obtenir des enregistrements pertinents. L’organisation des enregistrements sur CBT restrictif permet à Netezza de regrouper les enregistrements dans des partitions identiques ou proches. Ce processus crée également des mappages de zones qui améliorent les performances en réduisant la quantité de données à analyser.

Dans Azure Synapse, vous pouvez obtenir un effet similaire en utilisant le partitionnement et/ou l’utilisation d’autres index.
Vues matérialisées : Netezza prend en charge les vues matérialisées et recommande de créer une ou plusieurs de ces dernières sur de grandes tables ayant de nombreuses colonnes, où seules quelques-unes sont régulièrement utilisées dans les requêtes. Le système gère automatiquement les vues matérialisées lorsque les données de la table de base sont mises à jour.

Azure Synapse prend en charge les vues matérialisées, avec les mêmes fonctionnalités que Netezza.

Mappage de type de données Netezza

Conseil / Astuce

Évaluez l’impact des types de données non pris en charge dans le cadre de la phase de préparation.

La plupart des types de données Netezza ont un équivalent direct dans Azure Synapse. Le tableau suivant présente ces types de données ainsi que l’approche recommandée pour les mapper.

Type de données Netezza	Type de données Azure Synapse
BIGINT	BIGINT
BINAIRE VARIABLE(n)	VARBINARY(n)
BOOLEAN	BIT
BYTEINT	TINYINT
CARACTÈRE VARIABLE(n)	VARCHAR(n)
CARACTÈRE(n)	CHAR(n)
DATE	DATE(date)
DECIMAL(p,s)	DECIMAL(p,s)
DOUBLE PRÉCISION	FLOAT
FLOAT(n)	FLOAT(n)
INTEGER	INT
INTERVALLE	Les types de données INTERVAL ne sont actuellement pas directement pris en charge dans Azure Synapse, mais peuvent être calculés à l’aide de fonctions temporelles telles que DATEDIFF.
ARGENT	ARGENT
CARACTÈRE NATIONAL VARIABLE(n)	NVARCHAR(n)
CARACTÈRE NATIONAL(n)	NCHAR(n)
NUMERIC(p,s)	NUMERIC(p,s)
RÉEL	RÉEL
SMALLINT	SMALLINT
ST_GEOMETRY(n)	Les types de données spatiales tels que ST_GEOMETRY ne sont actuellement pas pris en charge dans Azure Synapse, mais les données peuvent être stockées en tant que VARCHAR ou VARBINARY.
TIME	TIME
TIME WITH TIME ZONE	DATETIMEOFFSET
TIMESTAMP	DateHeure

Génération de langage de définition de données (Data Definition Language, DDL)

Conseil / Astuce

Utilisez les métadonnées existantes de Netezza pour automatiser la génération de DDL pour CREATE TABLE et CREATE VIEW dans Azure Synapse.

Modifiez netezza CREATE TABLE et CREATE VIEW les scripts existants pour créer les définitions équivalentes avec des types de données modifiés, comme décrit précédemment si nécessaire. En règle générale, cela implique la suppression ou la modification de clauses spécifiques à Netezza supplémentaires telles que ORGANIZE ON.

Toutefois, toutes les informations qui spécifient les définitions actuelles des tables et des vues dans l’environnement Netezza existant sont conservées dans les tables de catalogue système. Il s’agit de la meilleure source de ces informations, car elles sont garanties d’être à jour et complètes. N’oubliez pas que la documentation gérée par l’utilisateur peut ne pas être synchronisée avec les définitions de table actuelles.

Accédez à ces informations à l’aide d’utilitaires tels que nz_ddl_table et générez les CREATE TABLE instructions DDL. Modifiez ces instructions pour les tables équivalentes dans Azure Synapse.

Conseil / Astuce

Les outils et services tiers peuvent automatiser les tâches de mappage de données.

Il existe des partenaires Microsoft qui proposent des outils et des services pour automatiser la migration, y compris le mappage de type de données. En outre, si un outil ETL tiers tel qu’Informatica ou Talend est déjà utilisé dans l’environnement Netezza, cet outil peut implémenter toutes les transformations de données requises.

Différences sql DML entre Netezza et Azure Synapse

Langage de manipulation de données SQL (DML)

Conseil / Astuce

Les commandes DML SQL, SELECTet INSERT ont des UPDATEéléments de base standard, mais peuvent également implémenter différentes options de syntaxe.

La norme ANSI SQL définit la syntaxe de base pour les commandes DML telles que SELECT, , INSERTUPDATEet DELETE. Netezza et Azure Synapse utilisent ces commandes, mais dans certains cas, il existe des différences d’implémentation.

Les sections suivantes décrivent les commandes DML spécifiques à Netezza que vous devez prendre en compte lors d’une migration vers Azure Synapse.

Différences de syntaxe SQL DML

Tenez compte de ces différences dans la syntaxe DML (SQL Data Manipulation Language) entre Netezza SQL et Azure Synapse lors de la migration :

STRPOS: dans Netezza, la STRPOS fonction retourne la position d’une sous-chaîne dans une chaîne. La fonction équivalente dans Azure Synapse est CHARINDEX, avec l’ordre des arguments inversés. Par exemple, SELECT STRPOS('abcdef','def')... dans Netezza est équivalent à SELECT CHARINDEX('def','abcdef')... Azure Synapse.
AGE: Netezza prend en charge l’opérateur AGE pour donner l’intervalle entre deux valeurs temporelles, telles que les horodatages ou les dates. Par exemple : SELECT AGE('23-03-1956','01-01-2019') FROM.... Dans Azure Synapse, DATEDIFF donne l’intervalle. Par exemple : SELECT DATEDIFF(day, '1956-03-26','2019-01-01') FROM.... Notez la séquence de représentation de date.
NOW(): Netezza utilise NOW() pour représenter CURRENT_TIMESTAMP dans Azure Synapse.

Fonctions, procédures stockées et séquences

Conseil / Astuce

Dans le cadre de la phase de préparation, évaluez le nombre et le type d’objets non-données migrés.

Lors de la migration à partir d’un environnement d’entrepôt de données hérité mature tel que Netezza, il existe souvent des éléments autres que des tables et vues simples qui doivent être migrées vers le nouvel environnement cible. Voici quelques exemples de fonctions, de procédures stockées et de séquences.

Dans le cadre de la phase de préparation, créez un inventaire des objets qui doivent être migrés et définissez les méthodes pour les gérer. Attribuez ensuite une allocation appropriée de ressources dans le plan de projet.

Il peut y avoir des installations dans l’environnement Azure qui remplacent les fonctionnalités implémentées en tant que fonctions ou procédures stockées dans l’environnement Netezza. Dans ce cas, il est souvent plus efficace d’utiliser les installations Azure intégrées plutôt que de décoder les fonctions Netezza.

Conseil / Astuce

Les produits et services tiers peuvent automatiser la migration d’éléments non-données.

Les partenaires Microsoft offrent des outils et des services qui peuvent automatiser la migration, y compris le mappage des types de données. En outre, les outils ETL tiers, tels que Informatica ou Talend, qui sont déjà utilisés dans l’environnement IBM Netezza peuvent implémenter toutes les transformations de données requises.

Pour plus d’informations sur chacun de ces éléments, consultez les sections suivantes.

Functions

Comme avec la plupart des produits de base de données, Netezza prend en charge les fonctions système et les fonctions définies par l’utilisateur dans l’implémentation SQL. Lors de la migration vers une autre plateforme de base de données telle qu’Azure Synapse, les fonctions système courantes sont disponibles et peuvent être migrées sans modification. Certaines fonctions système peuvent avoir une syntaxe légèrement différente, mais les modifications requises peuvent être automatisées. Les fonctions système où il n’existe aucun équivalent, par exemple des fonctions arbitraires définies par l’utilisateur, peuvent être recodées à l’aide des langages disponibles dans l’environnement cible. Azure Synapse utilise le langage de Transact-SQL populaire pour implémenter des fonctions définies par l’utilisateur. Les fonctions définies par l’utilisateur Netezza sont codées dans les langages nzlua ou C++.

Procédures stockées

La plupart des produits de base de données modernes permettent de stocker des procédures dans la base de données. Netezza fournit le langage NZPLSQL, basé sur Postgres PL/pgSQL. Une procédure stockée contient généralement des instructions SQL et une logique procédurale, et peut retourner des données ou un état.

Azure Synapse Analytics prend également en charge les procédures stockées à l’aide de T-SQL. Par conséquent, si vous devez migrer des procédures stockées, recodez-les en conséquence.

Séquences

Dans Netezza, une séquence est un objet de base de données nommé créé via CREATE SEQUENCE, qui peut fournir une valeur unique via la méthode NEXT VALUE FOR. Utilisez-les pour générer des nombres uniques à utiliser comme valeurs de clé de substitution pour les valeurs de clé primaire.

Dans Azure Synapse, il n’y a pas CREATE SEQUENCE. Les séquences sont gérées à l’aide d’IDENTITY pour créer des clés de substitution ou une identité managée à l’aide du code SQL pour créer le numéro de séquence suivant dans une série.

Utiliser EXPLAIN pour valider sql hérité

Conseil / Astuce

Recherchez des problèmes de migration potentiels à l’aide de requêtes réelles à partir des journaux de requêtes système existants.

Extraites quelques instructions SQL représentatives à partir des journaux d'historique des requêtes anciennes pour évaluer le SQL Netezza ancien pour la compatibilité avec Azure Synapse. Préfixez ensuite ces requêtes avec EXPLAIN et, en supposant un modèle de données migré « like for like » dans Azure Synapse avec les mêmes noms de table et de colonne, exécutez ces instructions EXPLAIN dans Azure Synapse. Tout SQL incompatible retourne une erreur. Utilisez ces informations pour déterminer l’échelle de la tâche de recodage. Cette approche ne nécessite pas de chargement de données dans l’environnement Azure, mais uniquement que les tables et vues appropriées ont été créées.

Mappage de IBM Netezza à T-SQL

Le mappage de type de données IBM Netezza to T-SQL conforme à Azure Synapse SQL se trouve dans ce tableau :

Type de données IBM Netezza	Type de données Azure Synapse SQL
tableau	Non pris en charge
bigint	bigint
objet volumineux binaire [(n[K\|M\|G])]	nvarchar [(n\|max)]
blob [(n[K\|M\|G])]	nvarchar [(n\|max)]
byte [(n)]	binary [(n)]\|varbinary(max)
byteint	smallint
char varying [(n)]	varchar [(n\|max)]
character varying [(n)]	varchar [(n\|max)]
char [(n)]	char [(n)]\|varchar(max)
caractère [(n)]	char [(n)]\|varchar(max)
character large object [(n[K\|M\|G])]	varchar [(n\|max)
clob [(n[K\|M\|G])]	varchar [(n\|max)
jeu de données	Non pris en charge
Date	Date
dec [(p[,s])]	décimale [(p[,s])]
décimale [(p[,s])]	décimale [(p[,s])]
double précision	float(53)
float [(n)]	float [(n)]
graphique [(n)]	nchar [(n)]\| varchar(max)
Intervalle	Non pris en charge
json [(n)]	nvarchar [(n \| max)]
long varchar	nvarchar(max)
long vargraphic	nvarchar(max)
mbb	Non pris en charge
mbr	Non pris en charge
nombre [(p\|*)[,s]]	numérique [(p[,s])]
numeric [(p [,s])]	numeric [(p[,s])]
Période	Non pris en charge
Réel	Réel
smallint	smallint
st_geométrie	Non pris en charge
Temps	Temps
heure avec fuseau horaire	décalage de date/heure
Horodatage	datetime2
timestamp avec fuseau horaire	datetimeoffset
varbyte	varbinary [(n\|max)]
varchar [(n)]	varchar [(n)]
vargraphic [(n)]	nvarchar [(n\|max)]
varray	Non pris en charge
Xml	Non pris en charge
xmltype	Non pris en charge

Résumé

Les installations héritées existantes de Netezza sont implémentées de manière à faciliter la migration vers Azure Synapse. Ils utilisent SQL pour les requêtes analytiques sur de grands volumes de données et sont sous une forme de modèle de données dimensionnel. Ces facteurs en font de bons candidats à la migration vers Azure Synapse.

Pour réduire la tâche de migration du code SQL réel, suivez les recommandations suivantes :

La migration initiale de l’entrepôt de données doit être effectuée telle quelle pour réduire les risques et le temps nécessaire, même si l’environnement final finira par incorporer un modèle de données différent tel qu’un modèle Data Vault.
Découvrez les différences entre l’implémentation de Netezza SQL et Azure Synapse.
Utilisez les métadonnées et les journaux d’activité de requête de l’implémentation De Netezza existante pour évaluer l’impact des différences et planifier une approche pour atténuer.
Automatisez le processus dans la mesure du possible pour réduire les erreurs, les risques et le temps de la migration.
Envisagez d’utiliser des partenaires et des services Microsoft spécialisés pour simplifier la migration.

Étapes suivantes

Pour en savoir plus sur les outils Microsoft et tiers, consultez l’article suivant de cette série : Outils pour la migration de l’entrepôt de données Netezza vers Azure Synapse Analytics.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-03-26

Réduire les problèmes SQL pour les migrations Netezza

Aperçu

Caractéristiques des environnements Netezza

Implémentation d’une migration pilotée par les métadonnées avec Azure Data Factory

Différences de DDL SQL entre Netezza et Azure Synapse

Langage de définition de données SQL (DDL)

Considérations relatives aux tables

Types d’objets de base de données Netezza non pris en charge

Mappage de type de données Netezza

Génération de langage de définition de données (Data Definition Language, DDL)

Différences sql DML entre Netezza et Azure Synapse

Langage de manipulation de données SQL (DML)

Différences de syntaxe SQL DML

Fonctions, procédures stockées et séquences

Functions

Procédures stockées

Séquences

Utiliser EXPLAIN pour valider sql hérité

Mappage de IBM Netezza à T-SQL

Résumé

Étapes suivantes

Commentaires

Ressources supplémentaires