Megosztás:


Sztringadatok összehasonlítása

A következőkre vonatkozik:SQL Server SSIS integrációs futtatókörnyezet az Azure Data Factory-ban

A sztring-összehasonlítások az Integrációs szolgáltatások által végrehajtott átalakítások jelentős részét képezik, és a sztring-összehasonlítások a változók és a tulajdonságkifejezések kifejezéseinek kiértékelése során is használatosak. A Rendezés átalakítás például egy adathalmaz értékeit hasonlítja össze az adatok növekvő vagy csökkenő sorrendbe rendezéséhez.

Átalakítások konfigurálása sztring-összehasonlításokhoz

A Rendezés, az Összesítés, az Fuzzy Grouping és a Fuzzy Lookup transzformációk testre szabhatók a sztringek oszlopszintű összehasonlítási módjának módosításához. Megadhatja például, hogy az összehasonlítás figyelmen kívül hagyja a kis- és nagybetűket, ami azt jelenti, hogy a nagybetűk és a kisbetűk azonos karakterként lesznek kezelve.

Az alábbi átalakítások olyan kifejezéseket használnak, amelyek sztring-összehasonlításokat is tartalmazhatnak.

  • A feltételes felosztásos átalakítás sztring-összehasonlításokat használhat a kifejezésekben annak meghatározásához, hogy melyik kimenetnek küldi el az adatsort. További információ: Feltételes felosztásos átalakítás.

  • A Származtatott oszlop átalakítás sztring-összehasonlításokat használhat a kifejezésekben új oszlopértékek létrehozásához. További információ: Származtatott oszlopátalakítás.

A változók, a változóleképezések és az elsőbbségi korlátozások kifejezéseket is használnak, amelyek sztring-összehasonlításokat is tartalmazhatnak. A kifejezésekről további információt az Integrációs szolgáltatások (SSIS) kifejezései című témakörben talál.

Karakterláncok összehasonlítása közbeni feldolgozás

Az adatoktól és az átalakítás konfigurációjától függően a sztringadatok összehasonlítása során a következő feldolgozás történhet:

  • Adatok konvertálása Unicode-ra. Ha a forrásadatok még nem Unicode formátumúak, a rendszer az összehasonlítás előtt automatikusan Unicode-ra konvertálja az adatokat.

  • Területi beállítás használata a dátum, az idő, a decimális adatok és a rendezési sorrend értelmezésére vonatkozó területi szabályok alkalmazásához.

  • Összehasonlítási lehetőségek alkalmazása az oszlop szintjén az összehasonlítások érzékenységének módosításához.

Sztringadatok konvertálása Unicode-ra

Az átalakítás által végrehajtott műveletektől és az átalakítás konfigurációjától függően a sztringadatok átalakíthatók DT_WSTR adattípusra, amely a sztringkarakterek Unicode-ábrázolása.

A DT_STR adattípusú sztringadatok Unicode-ra lesznek konvertálva az oszlop kódlapjával. Az Integration Services az oszlop szintjén támogatja a kódlapokat, és minden oszlop más kódlap használatával konvertálható.

Az Integrációs szolgáltatások a legtöbb esetben képesek azonosítani a megfelelő kódlapot az adatforrásból. Az SQL Serverben például beállíthatja a rendezést az adatbázis és az oszlop szintjén. A kódlap egy SQL Server-rendezésből származik, amely lehet Windows vagy SQL-rendezés.

Ha az Integration Services váratlan kódlapot biztosít, vagy ha a csomag olyan szolgáltatóval fér hozzá egy adatforráshoz, amely nem nyújt elegendő információt a megfelelő kódlap meghatározásához, megadhat egy alapértelmezett kódlapot az OLE DB-forrásban és az OLE DB-célhelyen. Az integrációs szolgáltatások által biztosított kódlapok helyett az alapértelmezett kódlapokat használja a rendszer.

A fájlok nem rendelkeznek kódlapokkal. Ehelyett az a csomag, amely a fájl adatokhoz csatlakozik, a Flat File és a Multiple Flat Files kapcsolatkezelőket használja, amelyek tartalmaznak egy tulajdonságot a fájl kódlapjának megadásához. A kódlap csak a fájl szintjén állítható be, az oszlop szintjén nem.

Helyi beállítások megadása

Az Integration Services nem használja a kódlapot az adatok rendezésére vagy a dátum, az idő és a decimális adatok értelmezésére vonatkozó területi szabályok következtetésére. Ehelyett az átalakítás beolvassa az adatfolyam-összetevő, adatfolyam-feladat, tároló vagy csomag LocaleId tulajdonsága által beállított területi beállításokat. Alapértelmezés szerint az átalakítás területi beállítása az adatfolyam-feladattól öröklődik, amely viszont a csomagtól öröklődik. Ha az adatfolyam-feladat egy olyan tárolóban található, mint a For Loop-tároló, a területi beállítását a tárolótól örökli.

Megadhat területi beállításokat egy Flat File kapcsolatkezelőhöz és egy több lapos fájl kapcsolatkezelőhöz is.

Összehasonlítási beállítások beállítása

A területi beállítás biztosítja a sztringadatok összehasonlításának alapvető szabályait. A területi beállítás például az ábécé betűinek rendezési helyét adja meg. Előfordulhat azonban, hogy ezek a szabályok nem elegendőek az egyes átalakítások által végrehajtott összehasonlításokhoz, és az Integration Services olyan speciális összehasonlítási lehetőségeket támogat, amelyek túlmutatnak a területi beállítások összehasonlítási szabályain. Ezek az összehasonlítási beállítások az oszlop szintjén vannak beállítva. Az összehasonlítási lehetőségek egyike például lehetővé teszi, hogy figyelmen kívül hagyja a nem elválasztó karaktereket. Ennek a beállításnak az a hatása, hogy figyelmen kívül hagyja az olyan ékezeteket, mint az ékezet, ami összehasonlítási célokra azonosvá teszi az "a" és az "Ã".

Az alábbi táblázat az összehasonlítási lehetőségeket és a rendezési stílust ismerteti.

Összehasonlítási lehetőség Description
Kis- és nagybetűk mellőzése Megadja, hogy az összehasonlítás megkülönbözteti-e a nagybetűket és a kisbetűket. Ha ez a beállítás be van állítva, a sztring-összehasonlítás figyelmen kívül hagyja a kis- és nagybetűket. Például az "ABC" ugyanaz lesz, mint az "abc".
Kana típus figyelmen kívül hagyása Megadja, hogy az összehasonlítás megkülönbözteti-e a japán kana karakterek két típusát: a hiragana és a katakana karaktert. Ha ez a beállítás engedélyezett, a sztring-összehasonlítás figyelmen kívül hagyja a kana típusát.
Karakterszélesség figyelmen kívül hagyása Meghatározza, hogy az összehasonlítás megkülönbözteti-e az egybájtos karaktert és ugyanazt a karaktert, ha kétbájtos karakterként van jelölve. Ha ez a beállítás be van állítva, a sztring-összehasonlítás azonos karakter egybájtos és kétbájtos ábrázolását kezeli.
Nem szóköz karakterek figyelmen kívül hagyása Meghatározza, hogy az összehasonlítás különbséget tesz-e a szóközök és a mellékjelek között. Ha ez a beállítás be van állítva, az összehasonlítás figyelmen kívül hagyja az ékezeteket. Például a "å" megegyezik az "a" karakterrel.
Szimbólumok figyelmen kívül hagyása Megadja, hogy az összehasonlítás megkülönbözteti-e a betűkaraktereket és a szimbólumokat, például a szóköz karaktereket, az írásjeleket, a pénznemszimbólumokat és a matematikai szimbólumokat. Ha ez a beállítás be van állítva, a sztring-összehasonlítás figyelmen kívül hagyja a szimbólumokat. Például a "New York" ugyanaz lesz, mint a "New York" és a "*ABC" ugyanaz, mint az "ABC".
Írásjelek rendezése szimbólumkénti kategóriába Megadja, hogy az összehasonlítás rendezi-e az összes írásjelszimbólumot, kivéve a kötőjelet és az aposztrófot az alfanumerikus karakterek elé. Ha például ez a beállítás van megadva, a ".ABC" az "ABC" elé rendeződik.

A Rendezés, összesítés, Fuzzy-csoportosítás és Fuzzy Lookup átalakítások közé tartoznak az adatok összehasonlítására szolgáló lehetőségek.

A Teljesen érzékeny összehasonlító jelölő a Speciális szerkesztő párbeszédpanelen jelenik meg a Fuzzy Grouping és a Fuzzy Lookup átalakításokhoz. A Teljes mértékben érzéketlen összehasonlító jelölő kiválasztása azt jelenti, hogy az összes összehasonlítási lehetőség érvényes.

Lásd még:

Integration Services-adattípusok
Gyors elemzés
Standard elemzés