Minimizar problemas de SQL para migrações do Netezza

Este artigo é a parte cinco de uma série de sete partes que fornece diretrizes sobre como migrar do Netezza para o Azure Synapse Analytics. O foco deste artigo são as práticas recomendadas para minimizar problemas de SQL.

Visão geral

Características dos ambientes do Netezza

Dica

A Netezza foi pioneira no conceito de "dispositivo de data warehouse" no início dos anos 2000.

Em 2003, a Netezza lançou inicialmente seu produto de dispositivo de data warehouse. Ele reduziu o custo de entrada e melhorou a facilidade de uso de técnicas de MPP (processamento paralelo maciço) para habilitar o processamento de dados em escala com mais eficiência do que o mainframe existente ou outras tecnologias de MPP disponíveis na época. Desde então, o produto evoluiu e tem muitas instalações entre grandes instituições financeiras, telecomunicações e empresas de varejo. A implementação original usava hardware proprietário, incluindo matrizes de portas programáveis em campo, ou FPGAs, e era acessível por meio de conexão de rede ODBC ou JDBC através de TCP/IP.

A maioria das instalações existentes do Netezza é local, então muitos usuários estão considerando migrar alguns ou todos os seus dados do Netezza para o Azure Synapse Analytics para obter os benefícios de uma mudança para um ambiente de nuvem moderno.

Dica

Muitas instalações existentes do Netezza são data warehouses usando um modelo de dados dimensional.

A tecnologia Netezza geralmente é usada para implementar um data warehouse, oferecendo suporte a consultas analíticas complexas em grandes volumes de dados usando SQL. Modelos de dados dimensionais — esquemas de estrela ou floco de neve — são comuns, assim como a implementação de data marts para departamentos individuais.

Essa combinação de modelos de dados SQL e dimensional simplifica a migração para o Azure Synapse, já que os conceitos básicos e as habilidades de SQL são transferíveis. A abordagem recomendada é migrar o modelo de dados existente as-is para reduzir o risco e o tempo necessários. Mesmo que a intenção eventual seja fazer alterações no modelo de dados (por exemplo, migrar para um modelo de cofre de dados), execute uma migração de as-is inicial e faça alterações no ambiente de nuvem do Azure, aproveitando o desempenho, a escalabilidade elástica e as vantagens de custo lá.

Embora a linguagem SQL tenha sido padronizada, fornecedores individuais implementaram, em alguns casos, extensões proprietárias. Este documento destaca possíveis diferenças de SQL que você pode encontrar ao migrar de um ambiente herdado do Netezza e fornece soluções alternativas.

Usar o Azure Data Factory para implementar uma migração controlada por metadados

Dica

Automatize o processo de migração usando os recursos do Azure Data Factory.

Automatizar e orquestrar o processo de migração usando os recursos no ambiente do Azure. Essa abordagem também minimiza o impacto da migração no ambiente existente do Netezza, que pode já estar em execução perto da capacidade total.

O Azure Data Factory é um serviço de integração de dados baseado em nuvem que permite a criação de fluxos de trabalho controlados por dados na nuvem para orquestrar e automatizar a movimentação de dados e a transformação de dados. Usando o Data Factory, você pode criar e agendar fluxos de trabalho controlados por dados, chamados de pipelines, que podem ingerir dados de armazenamentos de dados diferentes. Ele pode processar e transformar dados usando serviços de computação como o Azure HDInsight Hadoop, Spark, Azure Data Lake Analytics e Azure Machine Learning.

Ao criar metadados para listar as tabelas de dados a serem migradas e sua localização, você pode usar as instalações do Data Factory para gerenciar e automatizar partes do processo de migração. Você também pode usar o Azure Synapse Pipelines.

Diferenças de DDL do SQL entre o Netezza e o Azure Synapse

DDL (Linguagem de Definição de Dados SQL)

Dica

Os comandos DDL do SQL, CREATE TABLE e CREATE VIEW, têm elementos principais padrão, mas também são usados para definir opções específicas de implementação.

O padrão ANSI SQL define a sintaxe básica para comandos DDL, como CREATE TABLE e CREATE VIEW. Esses comandos são usados no Netezza e no Azure Synapse, mas também foram estendidos para permitir a definição de recursos específicos da implementação, como indexação, distribuição de tabela e opções de particionamento.

As seções a seguir discutem as opções específicas do Netezza a serem consideradas durante uma migração para o Azure Synapse.

Considerações sobre tabela

Dica

Use índices existentes para indicar candidatos à indexação no armazém migrado.

Ao migrar tabelas entre tecnologias diferentes, somente os dados brutos e seus metadados descritivos são movidos fisicamente entre os dois ambientes. Outros elementos de banco de dados do sistema de origem, como índices e arquivos de log, não são migrados diretamente, pois eles podem não ser necessários ou podem ser implementados de forma diferente dentro do novo ambiente de destino. Por exemplo, a opção TEMPORARY dentro da sintaxe de CREATE TABLE Netezza é equivalente a prefixar o nome da tabela com um caractere "#" no Azure Synapse.

É importante entender onde as otimizações de desempenho, como índices, foram usadas no ambiente de origem. Isso indica onde a otimização de desempenho pode ser adicionada no novo ambiente de destino. Por exemplo, se os mapas de zona foram criados no ambiente netezza de origem, isso pode indicar que um índice não clusterizado deve ser criado no banco de dados migrado do Azure Synapse. Outras técnicas nativas de otimização de desempenho, como a replicação de tabela, podem ser mais aplicáveis do que uma criação direta de índice por semelhança.

Tipos de objeto de banco de dados Netezza sem suporte

Dica

Recursos específicos do Netezza podem ser substituídos pelos recursos do Azure Synapse.

O Netezza implementa alguns objetos de banco de dados que não têm suporte direto no Azure Synapse, mas há métodos para obter a mesma funcionalidade no novo ambiente:

Mapas de zona: no Netezza, os mapas de zona são criados e mantidos automaticamente para alguns tipos de coluna e são usados no momento da consulta para restringir a quantidade de dados a serem verificados. Os mapas de zona são criados nos seguintes tipos de coluna:
- INTEGER colunas com 8 bytes ou menos.
- Colunas temporais. Por exemplo, DATE, TIMEe TIMESTAMP.
- Colunas CHAR, se elas forem parte de uma exibição materializada e mencionadas na cláusula ORDER BY.
Você pode descobrir quais colunas têm mapas de zona usando o nz_zonemap utilitário, que faz parte do NZ Toolkit. O Azure Synapse não inclui mapas de zona, mas você pode obter resultados semelhantes usando outros tipos de índice definidos pelo usuário e/ou particionamento.
Tabelas base clusterizados (CBT): no Netezza, as CBTs são comumente usadas para tabelas de fatos, que podem ter bilhões de registros. A verificação de uma tabela tão grande requer muito tempo de processamento, uma vez que uma verificação de tabela completa pode ser necessária para obter registros relevantes. A organização de registros na CBT restritiva permite que o Netezza agrupe registros nas mesmas extensões ou nas proximidades. Esse processo também cria mapas de zona que melhoram o desempenho reduzindo a quantidade de dados a serem verificados.

No Azure Synapse, você pode obter um efeito semelhante usando o particionamento e/ou o uso de outros índices.
Exibições materializadas: o Netezza dá suporte a exibições materializadas e recomenda a criação de uma ou mais delas em tabelas grandes com muitas colunas em que apenas algumas dessas colunas são usadas regularmente em consultas. O sistema mantém automaticamente exibições materializadas quando os dados na tabela base são atualizados.

O Azure Synapse dá suporte a exibições materializadas, com a mesma funcionalidade do Netezza.

Mapeamento de tipo de dados do Netezza

Dica

Avalie o impacto dos tipos de dados sem suporte como parte da fase de preparação.

A maioria dos tipos de dados do Netezza tem um equivalente direto no Azure Synapse. A tabela a seguir mostra esses tipos de dados junto com a abordagem recomendada para mapeá-los.

Tipo de dados Netezza	Tipo de dados do Azure Synapse
BIGINT	BIGINT
BINARY VARYING(n)	VARBINARY(n)
BOOLEAN	BIT
BYTEINT	TINYINT
CARACTER VARIÁVEL(n)	VARCHAR(n)
CHARACTER(n)	CHAR(n)
DATE	DATE(data)
DECIMAL(p,s)	DECIMAL(p,s)
Dupla precisão	FLOAT
FLOAT(n)	FLOAT(n)
INTEGER	INT
INTERVALO	Atualmente, os tipos de dados INTERVAL não têm suporte direto no Azure Synapse, mas podem ser calculados usando funções temporais, como DATEDIFF.
DINHEIRO	DINHEIRO
NATIONAL CHARACTER VARYING(n)	NVARCHAR(n)
CARACTERE NACIONAL(n)	NCHAR(n)
NUMERIC(p,s)	NUMERIC(p,s)
REAL	REAL
SMALLINT	SMALLINT
ST_GEOMETRY(n)	Atualmente, não há suporte para tipos de dados espaciais, como ST_GEOMETRY no Azure Synapse, mas os dados podem ser armazenados como VARCHAR ou VARBINARY.
TIME	TIME
TIME WITH TIME ZONE	DATETIMEOFFSET
TIMESTAMP	DATETIME

Geração de DDL (Linguagem de Definição de Dados)

Dica

Use metadados existentes do Netezza para automatizar a geração de DDL de CREATE TABLE e CREATE VIEW para o Azure Synapse.

Edite os scripts existentes do Netezza CREATE TABLE e CREATE VIEW para criar definições equivalentes com tipos de dados modificados, conforme descrito anteriormente, se necessário. Normalmente, isso envolve a remoção ou modificação de cláusulas adicionais específicas do Netezza, como ORGANIZE ON.

No entanto, todas as informações que especificam as definições atuais de tabelas e exibições no ambiente existente do Netezza são mantidas nas tabelas do catálogo do sistema. Essa é a melhor fonte dessas informações, pois elas têm a garantia de estarem atualizadas e concluídas. Lembre-se de que a documentação mantida pelo usuário pode não estar em sincronia com as definições de tabela atuais.

Acesse essas informações usando utilitários como nz_ddl_table e gere as CREATE TABLE instruções DDL. Edite esses comandos para as tabelas equivalentes no Azure Synapse.

Dica

Ferramentas e serviços de terceiros podem automatizar tarefas de mapeamento de dados.

Há parceiros da Microsoft que oferecem ferramentas e serviços para automatizar a migração, incluindo mapeamento de tipo de dados. Além disso, se uma ferramenta ETL de terceiros, como Informatica ou Talend, já estiver em uso no ambiente do Netezza, essa ferramenta poderá implementar todas as transformações de dados necessárias.

Diferenças de DML do SQL entre o Netezza e o Azure Synapse

DML (Linguagem de Manipulação de Dados SQL)

Dica

Os comandos DML do SQL, como SELECT, INSERT e UPDATE, possuem elementos principais padronizados, mas também podem implementar diferentes opções de sintaxe.

O padrão SQL ANSI define a sintaxe básica para comandos DML, como SELECT, INSERTe UPDATEDELETE. O Netezza e o Azure Synapse usam esses comandos, mas em alguns casos há diferenças de implementação.

As seções a seguir discutem os comandos DML específicos do Netezza que você deve considerar durante uma migração para o Azure Synapse.

Diferenças de sintaxe DML do SQL

Lembre-se dessas diferenças na sintaxe DML (Linguagem de Manipulação de Dados SQL) entre o NETezza SQL e o Azure Synapse ao migrar:

STRPOS: no Netezza, a STRPOS função retorna a posição de uma subcadeia de caracteres dentro de uma cadeia de caracteres. A função equivalente no Azure Synapse é CHARINDEX, com a ordem dos argumentos invertida. Por exemplo, SELECT STRPOS('abcdef','def')... no Netezza é equivalente ao SELECT CHARINDEX('def','abcdef')... no Azure Synapse.
AGE: o Netezza dá suporte ao operador AGE para fornecer o intervalo entre dois valores temporais, como carimbos de data/hora ou datas. Por exemplo, SELECT AGE('23-03-1956','01-01-2019') FROM.... No Azure Synapse, DATEDIFF fornece o intervalo. Por exemplo, SELECT DATEDIFF(day, '1956-03-26','2019-01-01') FROM.... Observe a sequência de representação de data.
NOW(): o Netezza usa NOW() para representar CURRENT_TIMESTAMP no Azure Synapse.

Funções, procedimentos armazenados e sequências

Dica

Como parte da fase de preparação, avalie o número e o tipo de objetos que não são de dados que estão sendo migrados.

Ao migrar de um ambiente de data warehouse herdado maduro, como o Netezza, muitas vezes há elementos diferentes de tabelas e exibições simples que precisam ser migrados para o novo ambiente de destino. Exemplos disso incluem funções, procedimentos armazenados e sequências.

Como parte da fase de preparação, crie um inventário dos objetos que precisam ser migrados e defina os métodos para lidar com eles. Em seguida, atribua uma alocação apropriada de recursos no plano de projeto.

Pode haver instalações no ambiente do Azure que substituem a funcionalidade implementada como funções ou procedimentos armazenados no ambiente do Netezza. Nesse caso, geralmente, é mais eficiente usar as instalações internas do Azure em vez de recodificar as funções do Netezza.

Dica

Produtos e serviços de terceiros podem automatizar a migração de elementos que não são de dados.

Os parceiros da Microsoft oferecem ferramentas e serviços que podem automatizar a migração, incluindo o mapeamento de tipos de dados. Além disso, ferramentas ETL de terceiros, como Informatica ou Talend, que já estão em uso no ambiente IBM Netezza podem implementar as transformações de dados necessárias.

Consulte as seções a seguir para obter mais informações sobre cada um desses elementos.

Functions

Assim como acontece com a maioria dos produtos de banco de dados, o Netezza dá suporte a funções do sistema e funções definidas pelo usuário dentro da implementação do SQL. Ao migrar para outra plataforma de banco de dados, como o Azure Synapse, as funções comuns do sistema estão disponíveis e podem ser migradas sem alterações. Algumas funções do sistema podem ter sintaxe ligeiramente diferente, mas as alterações necessárias podem ser automatizadas. Funções do sistema em que não há equivalente, como funções arbitrárias definidas pelo usuário, podem precisar ser recodificadas usando os idiomas disponíveis no ambiente de destino. O Azure Synapse usa a linguagem Transact-SQL popular para implementar funções definidas pelo usuário. As funções definidas pelo usuário do Netezza são codificadas em linguagens nzlua ou C++.

Procedimentos armazenados

A maioria dos produtos de banco de dados modernos permite que os procedimentos sejam armazenados no banco de dados. O Netezza fornece a linguagem NZPLSQL, que se baseia no Postgres PL/pgSQL. Um procedimento armazenado normalmente contém instruções SQL e alguma lógica de procedimento e pode retornar dados ou um status.

O Azure Synapse Analytics também dá suporte a procedimentos armazenados usando T-SQL, portanto, se você precisar migrar procedimentos armazenados, recodifice-os adequadamente.

Sequências

No Netezza, uma sequência é um objeto de banco de dados nomeado criado por meio de CREATE SEQUENCE, que pode fornecer um valor exclusivo usando o método NEXT VALUE FOR. Use-os para gerar números únicos para uso como chave substituta dos valores de chave primária.

No Azure Synapse, não há CREATE SEQUENCE. As sequências são tratadas usando IDENTITY para criar chaves substitutas ou identidade gerenciada usando o código SQL para criar o próximo número de sequência em uma série.

Usar EXPLAIN para validar o SQL herdado

Dica

Encontre possíveis problemas de migração usando consultas reais dos logs de consulta do sistema existentes.

Capture algumas instruções SQL representativas dos logs de histórico de consultas herdados para avaliar o SQL herdado do Netezza para compatibilidade com o Azure Synapse. Em seguida, prefixe essas consultas com EXPLAIN e, supondo que haja um modelo de dados migrado "like-for-like" no Azure Synapse com os mesmos nomes de tabela e coluna, então execute essas instruções EXPLAIN no Azure Synapse. Qualquer SQL incompatível retornará um erro. Use essas informações para determinar a escala da tarefa de recodificação. Essa abordagem não exige que os dados sejam carregados no ambiente do Azure, apenas que as tabelas e exibições relevantes tenham sido criadas.

Mapeamento do IBM Netezza para T-SQL

O mapeamento do IBM Netezza para T-SQL em conformidade com os tipos de dados SQL do Azure Synapse está nesta tabela:

Tipo de Dados do IBM Netezza	Tipo de Dados do SQL do Azure Synapse
array	Sem suporte
Bigint	bigint
objeto binário grande [(n[K\|M\|G])]	nvarchar [(n\|max)]
blob (n[K\|M\|G])	nvarchar [(n\|max)]
byte [(n)]	binary [(n)]\|varbinary(max)
byteint	Smallint
char variável [(n)]	varchar [(n\|max)]
character varying [(n)]	varchar [(n\|max)]
char [(n)]	char [(n)]\|varchar(max)
caractere [(n)]	char [(n)]\|varchar(max)
objeto grande de caracteres [(n[K\|M\|G])]	varchar [(n\|max)
clob [(n[K\|M\|G])]	varchar [(n\|max)
Conjunto de dados	Sem suporte
Data	Data
dec [(p[,s])]	decimal [(p[,s])]
decimal [(p[,s])]	decimal [(p[,s])]
precisão dupla	float(53)
float [(n)]	float [(n)]
gráfico [(n)]	nchar [(n)]\| varchar(max)
Intervalo	Sem suporte
json [(n)]	nvarchar [(n\|max)]
varchar longo	nvarchar(max)
vargraphic longo	nvarchar(max)
mbb	Sem suporte
mbr	Sem suporte
number [((p\|*)[,s])]	numeric [(p[,s])]
numeric [(p [,s])]	numérico [(p[,s])]
Período	Sem suporte
Real	Real
Smallint	Smallint
st_geometry	Sem suporte
Tempo	Tempo
time with time zone	Datetimeoffset
timestamp	datetime2
carimbo de data/hora com fuso horário	datetimeoffset
varbyte	varbinary [(n\|max)]
varchar [(n)]	varchar [(n)]
vargraphic [(n)]	nvarchar [(n\|max)]
varray	Sem suporte
Xml	Sem suporte
Xmltype	Sem suporte

Resumo

As instalações típicas do Netezza herdadas existentes são implementadas de uma maneira que facilita a migração para o Azure Synapse. Eles usam SQL para consultas analíticas em grandes volumes de dados e estão em alguma forma de modelo de dados dimensional. Esses fatores os tornam bons candidatos à migração para o Azure Synapse.

Para minimizar a tarefa de migrar o código SQL real, siga estas recomendações:

A migração inicial do data warehouse deve ser como está para minimizar o risco e o tempo necessários, mesmo que o ambiente final venha a incorporar um modelo de dados diferente, como o Data Vault.
Entenda as diferenças entre a implementação do SQL do Netezza e o Azure Synapse.
Use metadados e logs de consulta da implementação existente do Netezza para avaliar o impacto das diferenças e planejar uma abordagem para atenuar.
Automatize o processo sempre que possível para minimizar erros, riscos e tempo para a migração.
Considere usar parceiros e serviços especializados da Microsoft para simplificar a migração.

Próximas Etapas

Para saber mais sobre a Microsoft e ferramentas de terceiros, confira o próximo artigo desta série: Ferramentas para migração de data warehouse do Netezza para o Azure Synapse Analytics.

Comentários

Esta página foi útil?

Last updated on 2026-03-26

Minimizar problemas de SQL para migrações do Netezza

Visão geral

Características dos ambientes do Netezza

Usar o Azure Data Factory para implementar uma migração controlada por metadados

Diferenças de DDL do SQL entre o Netezza e o Azure Synapse

DDL (Linguagem de Definição de Dados SQL)

Considerações sobre tabela

Tipos de objeto de banco de dados Netezza sem suporte

Mapeamento de tipo de dados do Netezza

Geração de DDL (Linguagem de Definição de Dados)

Diferenças de DML do SQL entre o Netezza e o Azure Synapse

DML (Linguagem de Manipulação de Dados SQL)

Diferenças de sintaxe DML do SQL

Funções, procedimentos armazenados e sequências

Functions

Procedimentos armazenados

Sequências

Usar EXPLAIN para validar o SQL herdado

Mapeamento do IBM Netezza para T-SQL

Resumo

Próximas Etapas

Comentários

Recursos adicionais