Considerazioni internazionali su Integration Services
Microsoft SQL Server 2005 Integration Services supporta l'analisi e la manipolazione di dati multilingue, supporta tutte le impostazioni internazionali di Windows e include opzioni di confronto per l'ordinamento e il confronto di dati stringa.
Le trasformazioni di Integration Services per text mining e corrispondenze fuzzy potrebbero non funzionare correttamente in versioni diverse dall'inglese. In molte di queste versioni diverse dall'inglese, tuttavia, entrambi i tipi di trasformazione potrebbero restituire risultati utili, a seconda della lingua in questione.
Analisi indipendente dalle impostazioni internazionali
Integration Services include routine di analisi indipendenti dalle impostazioni internazionali utilizzabili per l'analisi di dati in formati specifici. Tali routine, denominate globalmente routine di analisi veloce, supportano solo le rappresentazioni dei formati di data utilizzate più di frequente, eseguono lo stesso tipo di analisi indipendentemente dalle impostazioni internazionali, non riconoscono i caratteri speciali dei dati di tipi Valuta e non convertono la rappresentazione esadecimale o scientifica dei dati integer. L'analisi veloce consente di migliorare notevolmente le prestazioni dei pacchetti di Integration Services privi di dipendenze delle impostazioni internazionali. Per ulteriori informazioni, vedere Analisi dei dati.
Impostazioni internazionali
Integration Services supporta le impostazioni internazionali a livello di oggetto di pacchetto, attività, contenitore e componente del flusso di dati. È inoltre possibile specificare le impostazioni internazionali dei gestori di eventi.
In un pacchetto possono venire utilizzate più impostazioni internazionali. Nel pacchetto potrebbero venire utilizzate, ad esempio, le impostazioni internazionali Inglese (Stati Uniti) mentre in un'attività del pacchetto vengono utilizzate le impostazioni internazionali Italiano (Italia) e in un'altra attività le impostazioni internazionali Giapponese (Giappone).
In un pacchetto di Integration Services è possibile utilizzare qualsiasi impostazione internazionale di Windows. Le impostazioni internazionali vengono specificate durante la creazione del pacchetto. Il comportamento del pacchetto non varia anche quando viene distribuito in computer con opzioni internazionali e della lingua diverse da quelle dell'ambiente di sviluppo, a meno che il pacchetto non utilizzi configurazioni per l'aggiornamento delle proprietà delle impostazioni internazionali.
Se, tuttavia, è necessario che il pacchetto utilizzi impostazioni internazionali diverse quando viene distribuito in altri server, è possibile creare configurazioni per specificare quali impostazioni internazionali utilizzare quando il pacchetto viene eseguito. Per ulteriori informazioni, vedere Impostazione delle proprietà di un pacchetto e Configurazioni di pacchetto.
Opzioni di confronto
Le impostazioni internazionali forniscono regole di base per il confronto tra i dati stringa di un flusso di dati. Le impostazioni internazionali determinano, ad esempio, la posizione di ordinamento di ogni lettera dell'alfabeto. Queste regole, tuttavia, potrebbero non essere sufficienti per il tipo di confronto desiderato. Integration Services supporta tuttavia un set di opzioni di confronto avanzate. Se, ad esempio, è stato specificato che i caratteri senza spaziatura devono essere ignorati, nei confronti i caratteri "a" e "á" sono considerati equivalenti. Per ulteriori informazioni, vedere Confronto di dati stringa.
Text mining
Le trasformazioni per il text mining, ovvero Estrazione termini e Ricerca termini, utilizzano un dizionario specifico. Dato che tale dizionario è disponibile solo in inglese, quando si utilizzano le trasformazioni di text mining con altre lingue, i risultati ottenuti potrebbero essere limitati. Microsoft supporta l'utilizzo di queste trasformazioni solo con la lingua inglese.
Tuttavia, a seconda della somiglianza linguistica di una lingua con l'inglese, la trasformazione Estrazione termini potrebbe restituire termini anche nell'altra lingua, mentre la trasformazione Ricerca termini potrebbe individuare e calcolare la frequenza di termini non inglesi. L'efficienza delle operazioni di text mining risulta maggiore se la somiglianza di una lingua con l'inglese è elevata. Ad esempio, la trasformazione Estrazione termini per il text mining di stringhe in svedese potrebbe risultare molto efficiente in quanto i delimitatori di parole e frasi utilizzati nella lingua svedese sono simili a quelli dell'inglese. È molto probabile invece che questa trasformazione non restituisca alcun risultato se utilizzata con il giapponese. Per ulteriori informazioni, vedere Trasformazione Estrazione termini e Trasformazione Ricerca termini.
Corrispondenza fuzzy
Le due trasformazioni Raggruppamento fuzzy e Ricerca fuzzy raggruppano record simili di un dataset ed eseguono ricerche in una tabella di riferimento in base a una corrispondenza fuzzy. Entrambe le trasformazioni risultano più efficienti quando i dati di testo includono più parole lunghe separate da uno spazio vuoto o da delimitatori. Il livello di tolleranza degli errori in lingue logografiche come il cinese in cui le parole sono spesso composte da pochi caratteri e non separate da alcuno spazio vuoto potrebbe risultare molto ridotto. In queste lingue è molto probabile che le trasformazioni non individuino errori di ortografia o parole in eccesso e mancanti. Per ulteriori informazioni, vedere Trasformazione Raggruppamento fuzzy e Trasformazione Ricerca fuzzy.
Vedere anche
Concetti
SQL Server Integration Services