Dosya karşıya yükleme kullanarak tablo oluşturma veya değiştirme

Dosya yükleme sayfasını kullanarak tablo oluşturma veya değiştirme, yönetilen bir Delta Lake tablosu oluşturmak veya üzerine yazmak için CSV, TSV veya JSON, Avro, Parquet ya da metin dosyalarını yüklemenize olanak tanır.

Unity Kataloğu'nda veya Hive meta veri deposunda yönetilen Delta tabloları oluşturabilirsiniz.

Uyarı

Ayrıca, bulut depolamadan dosya yüklemek için , veri ekleme kullanıcı arabirimi veya COPY INTO seçeneklerini kullanabilirsiniz.

Önemli

Yerel makinenizden küçük CSV, TSV, JSON, Avro, Parquet veya metin dosyalarını içeri aktararak Delta tablosu oluşturmak için kullanıcı arabirimini kullanabilirsiniz.

  • Dosya yükleme kullanarak tablo oluşturma veya değiştirme sayfası, aynı anda en fazla 10 dosya yüklemeyi destekler.
  • Karşıya yüklenen dosyaların toplam boyutu 2 gigabayttan küçük olmalıdır.
  • Dosyanın CSV, TSV, JSON, Avro, Parquet veya metin dosyası olması ve ".csv", ".tsv" (veya ".tab"), " ".json", ".avro", ".parquet" veya ".txt" uzantısına sahip olması gerekir.
  • zip ve tar gibi sıkıştırılmış dosyalar desteklenmez.

Dosyayı yükle

  1. Yeni Simge Yeni > Veri ekle veya karşıya yükle'ye tıklayın.
  2. Oluştur veya bir tabloyu değiştirtıklayın.
  3. Gözat öğesine tıklayın veya dosyaları doğrudan bırakma bölgesine sürükleyip bırakın.

Uyarı

İçeri aktarılan dosyalar, hesabınızdaki güvenli bir dahili konuma yüklenir ve günlük olarak çöp toplanır.

Önizleme, yapılandırma ve tablo oluşturma

İşlem kaynaklarına bağlanmadan hazırlama alanına veri yükleyebilirsiniz, ancak tablonuzu önizlemek ve yapılandırmak için etkin bir işlem kaynağı seçmeniz gerekir. Dosya yükleme kullanıcı arabirimi SQL ambarlarını, sunucusuz hesaplamayı ve ayrılmış hesaplamayı destekler. Grup kümeleri desteklenmez.

Karşıya yüklenen tablonun seçeneklerini yapılandırırken verilerinizin 50 satırının önizlemesini görüntüleyebilirsiniz. Verilerinizin sunusunu değiştirmek için dosya adının altındaki kılavuz veya liste düğmelerine tıklayın.

Azure Databricks, yönetilen tablolar için veri dosyalarını içeren şema için yapılandırılan konumlarda depolar. Şemada tablo oluşturmak için uygun izinlere sahip olmanız gerekir.

Aşağıdakileri yaparak tablo oluşturmak istediğiniz şemayı seçin:

  1. (Yalnızca Unity Kataloğu etkin çalışma alanları için) Bir katalog veya eski hive_metastoreseçebilirsiniz.
  2. Bir şema seçin.
  3. (İsteğe bağlı) Tablo adını düzenleyin.

Uyarı

Varolan tablonun üzerine yaz veya Yeni tablo oluşturöğesini seçmek için açılan listeyi kullanabilirsiniz. Ad çakışmaları olan yeni tablolar oluşturmaya çalışan işlemler bir hata iletisi görüntüler.

Tabloyu oluşturmadan önce seçenekleri veya sütunları yapılandırabilirsiniz.

Tabloyu oluşturmak için sayfanın alt kısmındaki Oluştur'a tıklayın.

Biçim seçenekleri

Biçim seçenekleri, karşıya yüklediğiniz dosya biçimine bağlıdır. Üst bilgi çubuğunda ortak biçim seçenekleri görüntülenirken, Gelişmiş öznitelikler iletişim kutusunda daha az yaygın kullanılan seçenekler bulunur.

  • CSV için aşağıdaki seçenekler kullanılabilir:
    • İlk satır üst bilgiyi içerir (varsayılan olarak etkin): Bu seçenek CSV/TSV dosyasının üst bilgi içerip içermediğini belirtir.
    • Sütun sınırlayıcısı: Sütunlar arasındaki ayırıcı karakter. Yalnızca tek bir karaktere izin verilir ve ters eğik çizgi desteklenmez. Bu, CSV dosyaları için varsayılan olarak virgül olarak kullanılır.
    • sütun türlerini otomatik olarak algıla (varsayılan olarak etkin): Dosya içeriğindeki sütun türlerini otomatik olarak algılayın. Önizleme tablosunda türleri düzenleyebilirsiniz. Bu false olarak ayarlanırsa, tüm sütun türleri STRINGolarak çıkarılır.
    • Satırların birden çok satıra yayılması (varsayılan olarak devre dışı): Bir sütunun değeri dosyada birden çok satıra yayılabilir mi.
    • Şemayı birden çok dosyada birleştirme: Şemayı birden çok dosyada çıkarma ve her dosyanın şemasını birleştirme durumunu değerlendirir. Devre dışı bırakılırsa, bir dosyadaki şema kullanılır.
  • JSON için aşağıdaki seçenekler kullanılabilir:
    • sütun türlerini otomatik olarak algıla (varsayılan olarak etkin): Dosya içeriğindeki sütun türlerini otomatik olarak algılayın. Önizleme tablosunda türleri düzenleyebilirsiniz. Bu false olarak ayarlanırsa, tüm sütun türleri STRINGolarak çıkarılır.
    • Satırların birden fazla satırı kapsaması (varsayılan olarak etkindir): Bir sütunun değerinin dosyada birden fazla satırı kapsayıp kapsayamayacağı.
    • Açıklamalara izin ver (varsayılan olarak etkin): Dosyada açıklamalara izin verilip verilmeyeceği.
    • Tek tırnak işaretine izin ver (varsayılan olarak etkin): Dosyada tek tırnak işaretine izin verilip verilmeyeceği.
    • Zaman damgasını anla (varsayılan olarak etkin): Zaman damgası dizelerinin TimestampType anlaşılmaya çalışılıp çalışılmayacağı.

Biçim seçeneklerini düzenlediğinizde veri önizlemesi otomatik olarak güncelleştirilir.

Uyarı

Birden çok dosyayı karşıya yüklediğinizde aşağıdaki kurallar geçerlidir:

  • Üst bilgi ayarları tüm dosyalara uygulanır. Veri kaybını önlemek için, üst bilgilerin tüm yüklenen dosyalarda tutarlı bir şekilde ya bulunmadığından ya da bulunduğundan emin olun.
  • Yüklenen dosyalar, tüm verileri satır olarak hedef tabloya ekleyip birleştirir. Dosya yükleme sırasında kayıtları birleştirme veya birleştirme desteklenmez.

Sütun adları ve türleri

Sütun adlarını ve türlerini düzenleyebilirsiniz.

  • Türleri düzenlemek için tür simgesine tıklayın.

    Uyarı

    STRUCT veya ARRAY için iç içe geçmiş türleri düzenleyemezsiniz.

  • Sütun adını düzenlemek için sütunun üst kısmındaki giriş kutusuna tıklayın.

    Sütun adları virgülleri, ters eğik çizgileri veya unicode karakterleri (emojiler gibi) desteklemez.

CSV ve JSON dosyaları için sütun veri türleri varsayılan olarak çıkarılır. Gelişmiş özniteliklerini devre dışı bırakarak tüm sütunları STRING tür olarak yorumlayabilir>sütun türlerini otomatik olarak algılayabilirsiniz.

Uyarı

  • Şema çıkarımı, sütun türlerinin en iyi şekilde algılanması için çaba gösterir. Sütun türlerinin değiştirilmesi, değerin hedef veri türüne doğru şekilde geçirilememesi durumunda bazı değerlerin NULL'a gönderilmesine neden olabilir. BIGINT sütununun DATE veya TIMESTAMP sütunlarına dönüştürülmesi desteklenmez. Databricks, önce bir tablo oluşturmanızı ve daha sonra SQL işlevlerini kullanarak bu sütunları dönüştürmenizi önerir.
  • Tablo sütun adlarını özel karakterlerle desteklemek için Dosya yükleme sayfasında tablo oluşturulurken veya değiştirilirken, Sütun Eşlemekullanılır.
  • Sütunlara açıklama eklemek için tabloyu oluşturun ve açıklama eklemek için Katalog Gezgini açın.

Desteklenen veri türleri

dosya yükleme kullanarak tablo oluşturma veya değiştirme sayfası aşağıdaki veri türlerini destekler. Tek tek veri türleri hakkında daha fazla bilgi için bkz . SQL veri türleri.

Veri Türü Açıklama
BIGINT 8 bayt imzalı tamsayı numaraları.
BOOLEAN Boole (true, false) değerleri.
DATE Saat dilimi olmayan yıl, ay ve gün alanlarının değerlerini içeren değerler.
DOUBLE 8 bayt çift hassasiyetli kayan nokta sayıları.
STRING Karakter dizesi değerleri.
TIMESTAMP Oturum yerel saat dilimiyle yıl, ay, gün, saat, dakika ve saniye alanlarının değerlerini içeren değerler.
STRUCT Bir alan dizisi tarafından açıklanan yapıya sahip değerler.
ARRAY Türe sahip bir öğe dizisini oluşturan değerler
elementType.
DECIMAL(P,S) Maksimum duyarlıklı P ve sabit ölçekli Ssayılar.

Bilinen sorunlar

BIGINT gibi tarihler 'yyyy' biçiminde olduğunda, DATE gibi atılamayan türlere atama hataları tetikleyebilir.