Aracılığıyla paylaş


Verileri Ayrıştırma

Şunlar için geçerlidir:SQL Server Azure Data Factory'de SSIS Tümleştirme Çalışma Zamanı

Paketlerdeki veri akışları, çeşitli standart ve özel veri türlerini kullanabilen heterojen veri depoları arasında veri ayıklar ve yükler. Bir veri akışında Integration Services kaynakları verileri ayıklama, dize verilerini ayrıştırma ve verileri Integration Services veri türüne dönüştürme işini yapar. Sonraki dönüştürmeler verileri ayrıştırarak farklı bir veri türüne dönüştürebilir veya farklı veri türlerine sahip sütun kopyaları oluşturabilir. Bileşenlerde kullanılan ifadeler bağımsız değişkenleri ve işlenenleri de farklı veri türlerine dönüştürebilir. Son olarak, veriler bir veri deposuna yüklendiğinde, hedef verileri ayrıştırarak hedefin kullandığı veri türüne dönüştürebilir. Daha fazla bilgi için bkz. Integration Services Veri Türleri.

İki tür ayrıştırma

Integration Services, verileri dönüştürmek için iki tür ayrıştırma sağlar: Hızlı ayrıştırma ve Standart ayrıştırma.

  • Hızlı ayrıştırma, yerel ayara özgü veri türü dönüştürmelerini desteklemeyen ve yalnızca en sık kullanılan tarih ve saat biçimlerini destekleyen hızlı, basit bir ayrıştırma yordamları kümesidir.

  • Standart ayrıştırma, Oleaut32.dll ve Ole2dsip.dll'de kullanılabilen Otomasyon veri türü dönüştürme API'leri tarafından sağlanan tüm veri türü dönüştürmelerini destekleyen zengin bir ayrıştırma yordamları kümesidir.

Hızlı Ayrıştırma

Hızlı ayrıştırma, verileri ayrıştırma için hızlı ve basit bir dizi yordam sağlar. Bu yordamlar yerel ayara duyarlı değildir ve yalnızca tarih, saat ve tamsayı biçimlerinin bir alt kümesini destekler.

Gereksinimler ve sınırlamalar

Bir paket, hızlı ayrıştırma uygulayarak tarih, saat ve sayısal verileri yerel ayara özgü biçimlerde ve çoğu sık kullanılan ISO 8601 temel ve genişletilmiş biçimlerde yorumlama becerisini kaybeder, ancak paket performansını artırır. Örneğin, hızlı ayrıştırma yalnızca YYYYMMDD ve YYYY-AA-GG gibi en yaygın kullanılan tarih biçimi gösterimlerini destekler, yerel ayara özgü ayrıştırma gerçekleştirmez, para birimi verilerindeki özel karakterleri tanımaz ve tamsayıların onaltılık veya bilimsel gösterimini dönüştüremez.

Hızlı ayrıştırma yalnızca Düz Dosya kaynağını veya Veri Dönüştürme dönüştürmesini kullandığınızda kullanılabilir. Performans artışı önemli olabilir ve bu veri akışı bileşenlerinde hızlı ayrıştırma kullanmayı göz önünde bulundurmalısınız.

Paketteki veri akışı yerel ayara duyarlı ayrıştırma gerektiriyorsa, hızlı ayrıştırma yerine standart ayrıştırma önerilir. Örneğin, hızlı ayrıştırma virgül gibi ondalık simgeleri, yıl-ay-tarih biçimleri dışındaki tarih biçimlerini ve para birimi simgelerini içeren yerel ayara duyarlı verileri tanımaz.

Bir yüzyıl, yıl veya ay gibi bir veya daha fazla tarih parçası anlamına gelen kesilmiş gösterimler hızlı ayrıştırma tarafından tanınmaz. Örneğin, hızlı ayrıştırma, zımni bir yüzyılda bir yıl ve ay belirten '-YYMM' biçimini veya zımni bir yılda bir ay belirten '--MM' biçimini tanımaz. Ancak, hassasiyeti azaltılmış bazı temsiller tanınır. Örneğin, hızlı ayrıştırma yalnızca saat ve dakikayı gösteren 'ssmm;' biçimini ve yalnızca yılı belirten 'YYYY' biçimini tanır.

Hızlı ayrıştırma sütun düzeyinde belirtilir. Düz Dosya kaynağında ve Veri Dönüştürme dönüşümünde, çıkış sütunlarında Hızlı ayrıştır seçeneğini belirtebilirsiniz. Girişler ve çıkışlar hem yerel ayara duyarlı hem de yerel ayara duyarlı olmayan sütunlar içerebilir.

Sayısal veri biçimleri (Hızlı Ayrıştır)

Hızlı ayrıştırma, verileri ayrıştırma için hızlı, basit, yerel ayara duyarsız bir dizi yordam sağlar. Hızlı ayrıştırma, tamsayı veri türleri için yalnızca sınırlı bir biçim kümesini destekler.

Tamsayı veri tipi

Integration Services'ın sağladığı tamsayı veri türleri DT_I1, DT_UI1, DT_I2, DT_UI2, DT_I4, DT_UI4, DT_I8 ve DT_UI8'dır. Daha fazla bilgi için bkz. Integration Services Veri Türleri.

Hızlı ayrıştırma, tamsayı veri türleri için aşağıdaki biçimleri destekler:

  • Sıfır veya daha fazla baştaki ve sondaki boşluklar veya sekme durakları. Örneğin, " 123 " değeri geçerlidir. Tüm boşluklar olan bir değer sıfır olarak değerlendirilir.

  • Baştaki artı işareti, eksi işareti veya hiçbiri. Örneğin, +123, -123 ve 123 değerleri geçerlidir.

  • Bir veya daha fazla Hint-Arap rakamı (0-9). Örneğin, 345 değeri geçerlidir. Diğer dil numaraları desteklenmez.

Desteklenmeyen veri biçimleri şunları içerir:

  • Özel karakterler. Örneğin$ para birimi karakteri desteklenmez ve 20 TL değeri ayrıştırılamaz.

  • Satır sonu, satır dönüşü ve kesilmeyen boşluklar gibi boşluk karakterleri. Örneğin, "123" değeri ayrıştırılamaz.

  • Tamsayıların onaltılık gösterimleri. Örneğin, 2EE değeri ayrıştırılamaz.

  • Tamsayıların bilimsel gösterimi. Örneğin, 1E+10 değeri ayrıştırılamaz.

Aşağıdaki biçimler tamsayılar için çıkış veri biçimleridir:

  • Negatif sayılar için eksi işareti ve pozitif sayılar için hiçbir şey yok.

  • Beyaz boşluk yok.

  • Bir veya daha fazla Hint-Arap rakamı (0-9).

Tarih ve saat biçimleri (Hızlı Ayrıştır)

Hızlı ayrıştırma, verileri ayrıştırma için hızlı ve basit bir dizi yordam sağlar. Hızlı ayrıştırma, tarih ve saat veri türleri için aşağıdaki biçimleri destekler.

Tarih veri türü

Hızlı ayrıştırma, tarih verileri için aşağıdaki dize biçimlerini destekler:

  • Baştaki boşlukları içeren tarih biçimleri. Örneğin, "2004- 02-03" değeri geçerlidir.

  • ISO 8601 biçimleri, aşağıdaki tabloda listelendiği gibi:

    Biçim Description
    YYYYAAGG

    YYYY-MM-DD
    Dört basamaklı yıl, iki basamaklı ay ve iki basamaklı bir gün için temel ve genişletilmiş biçimler. Genişletilmiş biçimde, tarih bölümleri kısa çizgi (-) ile ayrılır.
    YYYY-MM Dört basamaklı yıl ve iki basamaklı ay için temel ve genişletilmiş azaltılmış duyarlık formatları. Genişletilmiş biçimde, tarih bölümleri kısa çizgi (-) ile ayrılır.
    YYYY Azaltılmış doğruluk formatı dört basamaklı bir yıldır.

Hızlı ayrıştırma, tarih verileri için aşağıdaki biçimleri desteklemez:

  • Alfabetik ay değerleri. Örneğin, 31 Ekim 2003 tarih biçimi geçerli değildir.

  • DD-MM-YYYY ve AA-GG-YYYY gibi belirsiz biçimler. Örneğin, 03-04-1995 ve 04-03-1995 tarihleri geçerli değildir.

  • Dört basamaklı takvim yılı ve yıl içindeki üç basamaklı gün için temel ve genişletilmiş kesilmiş biçimler, YYYYDDD ve YYYY-DDD.

  • Dört basamaklı yıl için temel ve genişletilmiş biçimler, yılın haftası için iki basamaklı bir sayı ve haftanın günü için tek basamaklı bir sayı, YYYYWwwD ve YYYY-Www-D

  • Bir yıl ve hafta tarihi için temel ve genişletilmiş kısaltılmış biçimler, dört basamaklı bir yıl ve hafta için iki basamaklı bir sayıdır, YYYWww ve YYYY-Www

Hızlı ayrıştırma, verileri DT_DBDATE olarak çıkış formatında verir. Kesilmiş biçimlerdeki tarih değerleri doldurulur. Örneğin, YYYY YYYY0101 olur.

Daha fazla bilgi için bkz. Integration Services Veri Türleri.

Zaman veri türü

Hızlı ayrıştırma, zaman verileri için aşağıdaki dize biçimlerini destekler:

  • Baştaki beyaz boşlukları içeren zaman biçimleri. Örneğin, "10:24" değeri geçerlidir.

  • 24 saatlik biçim. Hızlı ayrıştırma, AM ve PM gösterimini desteklemez.

  • ISO 8601 saat biçimleri, aşağıdaki tabloda listelendiği gibi:

    Biçim Description
    HHMISS

    HH:MM:SS
    İki basamaklı saat, iki basamaklı dakika ve iki basamaklı saniye için temel ve genişletilmiş biçimler. Genişletilmiş biçimde, zaman bölümleri iki nokta üst üste (:)) ile ayrılır.
    HHMI

    SS:MI
    İki basamaklı bir saat ve iki basamaklı bir dakika için temel ve genişletilmiş kısaltılmış biçim. Genişletilmiş biçimde, zaman bölümleri iki nokta üst üste (:)) ile ayrılır.
    HH İki basamaklı saat için kısaltılmış format.
    00:00:00

    000000

    0000

    00

    240000

    24:00:00

    2400

    yirmi dört
    Gece yarısı saat formatı.
  • Aşağıdaki tabloda listelendiği gibi saat dilimini belirten saat biçimleri:

    Biçim Description
    +HH:MI

    +HHMI
    Yerel saati elde etmek için Eşgüdümlü Evrensel Saat'e (UTC) eklenen saat ve dakika sayısını gösteren temel ve genişletilmiş biçimler.
    -HH:MI

    -HHMI
    Yerel saati elde etmek için UTC'den çıkarılmış saat ve dakika sayısını gösteren temel ve genişletilmiş biçimler.
    +HH Yerel saati elde etmek için UTC'ye eklenen saat sayısını gösteren kesilmiş biçim.
    -HH Yerel saati elde etmek için UTC'den çıkarılmış saat sayısını gösteren kesilmiş biçim.
    Z Saat değerinin UTC olarak gösterildiğini gösteren 0 değeri.

    Tüm saat ve tarih/saat verilerinin biçimleri bir saat dilimi öğesi içerebilir. Ancak sistem, verilerin DT_DBTIMESTAMPOFFSET türünde olması dışında saat dilimi değerini yoksayar. Daha fazla bilgi için bkz. Integration Services Veri Türleri.

    Saat dilimi öğesi içeren biçimlerde, aşağıdaki örnekte gösterildiği gibi saat öğesi ile saat dilimi öğesi arasında boşluk yoktur:

    HH:MI:SS[+HH:MI]

    Önceki örnekteki köşeli ayraçlar saat dilimi değerinin isteğe bağlı olduğunu gösterir.

  • Aşağıdaki tabloda listelendiği gibi ondalık kesir içeren saat biçimleri:

    Biçim Description
    HH[.nnnnnnn] n, saatlerin bir bölümünü temsil eden 0 ile 9999999 arasındaki bir değerdir. Köşeli ayraçlar bu değerin isteğe bağlı olduğunu gösterir.

    Örneğin, 12.750 değeri 12:45'i gösterir.
    HHMI[.nnnnnnn]

    HH:MI[.nnnnnnn]
    n, dakikaların bir bölümünü temsil eden 0 ile 9999999 arasındaki bir değerdir. Köşeli ayraçlar bu değerin isteğe bağlı olduğunu gösterir.

    Örneğin, 1220.500 değeri 12:20:30 değerini gösterir.
    HHMISS[.nnnnnnn]

    HH:MI:SS[.nnnnnnn]
    n, saniyenin bir bölümünü temsil eden 0 ile 9999999 arasındaki bir değerdir. Köşeli ayraçlar bu değerin isteğe bağlı olduğunu gösterir.

    Örneğin, 122040.250 değeri 12:20:40.15'i gösterir.

    Uyarı

    Önceki tablodaki saat biçimlerinin kesir ayırıcısı ondalık veya virgül olabilir.

  • Aşağıdaki örneklerde gösterildiği gibi artık saniye içeren zaman değerleri:

    23:59:60[.0000000]

    235960[.0000000]

Hızlı ayrıştırma, dizeleri DT_DBTIME ve DT_DBTIME2 olarak verir. Kesilmiş biçimlerdeki zaman değerleri doldurulur. Örneğin, HH:MI, SS:DD:00.000 olur.

Daha fazla bilgi için bkz. Integration Services Veri Türleri.

Tarih/Saat veri türü

Hızlı ayrıştırma, tarih/saat verileri için aşağıdaki dize biçimlerini destekler:

  • Baştaki beyaz boşlukları içeren biçimler. Örneğin, "2003-01-10T203910" değeri geçerlidir.

  • Büyük harf T ile ayrılmış geçerli tarih biçimlerinin ve geçerli saat biçimlerinin birleşimleri ve YYYYYMMDDT[HHMISS][+HH:MI] gibi geçerli saat dilimi biçimleri. Saat ve saat dilimi değerleri gerekli değildir. Örneğin, "2003-10-14" geçerli.

Hızlı ayrıştırma zaman aralıklarını desteklemez. Örneğin, YYYYMMDDThhmmss/YYYYMMDDThhmmss biçiminde bir başlangıç ve bitiş tarihi ve saati ile tanımlanan zaman aralığı ayrıştırılamaz.

Hızlı ayrıştırma dizeleri DT_DATE, DT_DBTIMESTAMP, DT_DBTIMESTAMP2 ve DT_DBTIMESTAMPOFFSET olarak verir. Kesilmiş biçimlerdeki tarih/saat değerleri doldurulur. Aşağıdaki tabloda, eksik tarih ve saat bölümleri için eklenen değerler listelenmiştir.

Tarih/Saat bölümü Doldurma
Saniye 00 ekleyin.
Minutes 00:00 ekleyin.
Saat 00:00:00 ekleyin.
Day Ayın günü için 01 ekleyin.
Ay Yılın ayı için 01 ekleyin.

Daha fazla bilgi için bkz. Integration Services Veri Türleri.

Hızlı Ayrıştırma'yı etkinleştirme

Hızlı ayrıştırma özelliği, kaynağın veya dönüşümün hızlı ayrıştırma kullanan her sütunu için ayarlanmalıdır. Özelliği ayarlamak için Düz Dosya kaynağının Gelişmiş düzenleyicisini ve Veri Dönüştürme dönüşümünü kullanın.

  1. Düz Dosya kaynağına veya Veri Dönüştürme dönüşümüne sağ tıklayın ve gelişmiş düzenleyiciyi göster'e tıklayın.

  2. Gelişmiş Düzenleyici iletişim kutusunda Giriş ve Çıkış Özellikleri sekmesine tıklayın.

  3. Girişler ve Çıkışlar bölmesinde, hızlı ayrıştırma özelliğini etkinleştirmek istediğiniz sütuna tıklayın.

  4. Özellikler penceresinde Özel Özellikler düğümünü genişletin ve FastParse özelliğini True olarak ayarlayın.

  5. Tamam'a tıklayın.

Standart Ayrıştırma

Standart ayrıştırma, Oleaut32.dll ve Ole2dsip.dll'de kullanılabilen Otomasyon veri türü dönüştürme API'leri tarafından sağlanan tüm veri türü dönüştürmelerini destekleyen yerel ayara duyarlı bir ayrıştırma yordamları kümesidir. Standart ayrıştırma, OLE DB ayrıştırma API'lerine eşdeğerdir.

Standart ayrıştırma, uluslararası verilerin veri türü dönüştürmesi için destek sağlar ve veri biçimi Hızlı ayrıştırma tarafından desteklenmiyorsa kullanılmalıdır.