Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Dosya yükleme sayfasını kullanarak tablo oluşturma veya değiştirme, yönetilen bir Delta Lake tablosu oluşturmak veya üzerine yazmak için CSV, TSV veya JSON, Avro, Parquet ya da metin dosyalarını yüklemenize olanak tanır.
Unity Kataloğu'nda veya Hive meta veri deposunda yönetilen Delta tabloları oluşturabilirsiniz.
Uyarı
Ayrıca, bulut depolamadan dosya yüklemek için , veri ekleme kullanıcı arabirimi veya COPY INTO seçeneklerini kullanabilirsiniz.
Önemli
- Hedef şemada tablo oluşturmak için çalışan bir işlem kaynağına ve izinlerine erişiminiz olmalıdır.
- Çalışma alanı yöneticileri dosya yükleme sayfasını kullanarak tablo oluşturma veya değiştirme sayfasınıdevre dışı bırakabilir.
Yerel makinenizden küçük CSV, TSV, JSON, Avro, Parquet veya metin dosyalarını içeri aktararak Delta tablosu oluşturmak için kullanıcı arabirimini kullanabilirsiniz.
- Dosya yükleme kullanarak tablo oluşturma veya değiştirme sayfası, aynı anda en fazla 10 dosya yüklemeyi destekler.
- Karşıya yüklenen dosyaların toplam boyutu 2 gigabayttan küçük olmalıdır.
- Dosyanın CSV, TSV, JSON, Avro, Parquet veya metin dosyası olması ve ".csv", ".tsv" (veya ".tab"), " ".json", ".avro", ".parquet" veya ".txt" uzantısına sahip olması gerekir.
-
zipvetargibi sıkıştırılmış dosyalar desteklenmez.
Dosyayı yükle
-
Yeni > Veri ekle veya karşıya yükle'ye tıklayın. - Oluştur veya bir tabloyu değiştirtıklayın.
- Gözat öğesine tıklayın veya dosyaları doğrudan bırakma bölgesine sürükleyip bırakın.
Uyarı
İçeri aktarılan dosyalar, hesabınızdaki güvenli bir dahili konuma yüklenir ve günlük olarak çöp toplanır.
Önizleme, yapılandırma ve tablo oluşturma
İşlem kaynaklarına bağlanmadan hazırlama alanına veri yükleyebilirsiniz, ancak tablonuzu önizlemek ve yapılandırmak için etkin bir işlem kaynağı seçmeniz gerekir. Dosya yükleme kullanıcı arabirimi SQL ambarlarını, sunucusuz hesaplamayı ve ayrılmış hesaplamayı destekler. Grup kümeleri desteklenmez.
Karşıya yüklenen tablonun seçeneklerini yapılandırırken verilerinizin 50 satırının önizlemesini görüntüleyebilirsiniz. Verilerinizin sunusunu değiştirmek için dosya adının altındaki kılavuz veya liste düğmelerine tıklayın.
Azure Databricks, yönetilen tablolar için veri dosyalarını içeren şema için yapılandırılan konumlarda depolar. Şemada tablo oluşturmak için uygun izinlere sahip olmanız gerekir.
Aşağıdakileri yaparak tablo oluşturmak istediğiniz şemayı seçin:
- (Yalnızca Unity Kataloğu etkin çalışma alanları için) Bir katalog veya eski
hive_metastoreseçebilirsiniz. - Bir şema seçin.
- (İsteğe bağlı) Tablo adını düzenleyin.
Uyarı
Varolan tablonun üzerine yaz veya Yeni tablo oluşturöğesini seçmek için açılan listeyi kullanabilirsiniz. Ad çakışmaları olan yeni tablolar oluşturmaya çalışan işlemler bir hata iletisi görüntüler.
Tabloyu oluşturmadan önce seçenekleri veya sütunları yapılandırabilirsiniz.
Tabloyu oluşturmak için sayfanın alt kısmındaki Oluştur'a tıklayın.
Biçim seçenekleri
Biçim seçenekleri, karşıya yüklediğiniz dosya biçimine bağlıdır. Üst bilgi çubuğunda ortak biçim seçenekleri görüntülenirken, Gelişmiş öznitelikler iletişim kutusunda daha az yaygın kullanılan seçenekler bulunur.
- CSV için aşağıdaki seçenekler kullanılabilir:
- İlk satır üst bilgiyi içerir (varsayılan olarak etkin): Bu seçenek CSV/TSV dosyasının üst bilgi içerip içermediğini belirtir.
- Sütun sınırlayıcısı: Sütunlar arasındaki ayırıcı karakter. Yalnızca tek bir karaktere izin verilir ve ters eğik çizgi desteklenmez. Bu, CSV dosyaları için varsayılan olarak virgül olarak kullanılır.
-
sütun türlerini otomatik olarak algıla (varsayılan olarak etkin): Dosya içeriğindeki sütun türlerini otomatik olarak algılayın. Önizleme tablosunda türleri düzenleyebilirsiniz. Bu false olarak ayarlanırsa, tüm sütun türleri
STRINGolarak çıkarılır. - Satırların birden çok satıra yayılması (varsayılan olarak devre dışı): Bir sütunun değeri dosyada birden çok satıra yayılabilir mi.
- Şemayı birden çok dosyada birleştirme: Şemayı birden çok dosyada çıkarma ve her dosyanın şemasını birleştirme durumunu değerlendirir. Devre dışı bırakılırsa, bir dosyadaki şema kullanılır.
- JSON için aşağıdaki seçenekler kullanılabilir:
-
sütun türlerini otomatik olarak algıla (varsayılan olarak etkin): Dosya içeriğindeki sütun türlerini otomatik olarak algılayın. Önizleme tablosunda türleri düzenleyebilirsiniz. Bu false olarak ayarlanırsa, tüm sütun türleri
STRINGolarak çıkarılır. - Satırların birden fazla satırı kapsaması (varsayılan olarak etkindir): Bir sütunun değerinin dosyada birden fazla satırı kapsayıp kapsayamayacağı.
- Açıklamalara izin ver (varsayılan olarak etkin): Dosyada açıklamalara izin verilip verilmeyeceği.
- Tek tırnak işaretine izin ver (varsayılan olarak etkin): Dosyada tek tırnak işaretine izin verilip verilmeyeceği.
-
Zaman damgasını anla (varsayılan olarak etkin): Zaman damgası dizelerinin
TimestampTypeanlaşılmaya çalışılıp çalışılmayacağı.
-
sütun türlerini otomatik olarak algıla (varsayılan olarak etkin): Dosya içeriğindeki sütun türlerini otomatik olarak algılayın. Önizleme tablosunda türleri düzenleyebilirsiniz. Bu false olarak ayarlanırsa, tüm sütun türleri
Biçim seçeneklerini düzenlediğinizde veri önizlemesi otomatik olarak güncelleştirilir.
Uyarı
Birden çok dosyayı karşıya yüklediğinizde aşağıdaki kurallar geçerlidir:
- Üst bilgi ayarları tüm dosyalara uygulanır. Veri kaybını önlemek için, üst bilgilerin tüm yüklenen dosyalarda tutarlı bir şekilde ya bulunmadığından ya da bulunduğundan emin olun.
- Yüklenen dosyalar, tüm verileri satır olarak hedef tabloya ekleyip birleştirir. Dosya yükleme sırasında kayıtları birleştirme veya birleştirme desteklenmez.
Sütun adları ve türleri
Sütun adlarını ve türlerini düzenleyebilirsiniz.
Türleri düzenlemek için tür simgesine tıklayın.
Uyarı
STRUCTveyaARRAYiçin iç içe geçmiş türleri düzenleyemezsiniz.Sütun adını düzenlemek için sütunun üst kısmındaki giriş kutusuna tıklayın.
Sütun adları virgülleri, ters eğik çizgileri veya unicode karakterleri (emojiler gibi) desteklemez.
CSV ve JSON dosyaları için sütun veri türleri varsayılan olarak çıkarılır.
Gelişmiş özniteliklerini devre dışı bırakarak tüm sütunları STRING tür olarak yorumlayabilir>sütun türlerini otomatik olarak algılayabilirsiniz.
Uyarı
- Şema çıkarımı, sütun türlerinin en iyi şekilde algılanması için çaba gösterir. Sütun türlerinin değiştirilmesi, değerin hedef veri türüne doğru şekilde geçirilememesi durumunda bazı değerlerin
NULL'a gönderilmesine neden olabilir.BIGINTsütunununDATEveyaTIMESTAMPsütunlarına dönüştürülmesi desteklenmez. Databricks, önce bir tablo oluşturmanızı ve daha sonra SQL işlevlerini kullanarak bu sütunları dönüştürmenizi önerir. - Tablo sütun adlarını özel karakterlerle desteklemek için Dosya yükleme sayfasında tablo oluşturulurken veya değiştirilirken, Sütun Eşlemekullanılır.
- Sütunlara açıklama eklemek için tabloyu oluşturun ve açıklama eklemek için Katalog Gezgini açın.
Desteklenen veri türleri
dosya yükleme kullanarak tablo oluşturma veya değiştirme
| Veri Türü | Açıklama |
|---|---|
BIGINT |
8 bayt imzalı tamsayı numaraları. |
BOOLEAN |
Boole (true, false) değerleri. |
DATE |
Saat dilimi olmayan yıl, ay ve gün alanlarının değerlerini içeren değerler. |
DOUBLE |
8 bayt çift hassasiyetli kayan nokta sayıları. |
STRING |
Karakter dizesi değerleri. |
TIMESTAMP |
Oturum yerel saat dilimiyle yıl, ay, gün, saat, dakika ve saniye alanlarının değerlerini içeren değerler. |
STRUCT |
Bir alan dizisi tarafından açıklanan yapıya sahip değerler. |
ARRAY |
Türe sahip bir öğe dizisini oluşturan değerlerelementType. |
DECIMAL(P,S) |
Maksimum duyarlıklı P ve sabit ölçekli Ssayılar. |
Bilinen sorunlar
BIGINT gibi tarihler 'yyyy' biçiminde olduğunda, DATE gibi atılamayan türlere atama hataları tetikleyebilir.