Aracılığıyla paylaş


LOAD DATA

Şunlar için geçerlidir: onay işareti evet olarak işaretlenmiş Databricks Runtime

Verileri, kullanıcı tarafından belirtilen dizinden veya dosyadan hive serde tablosuna yükler. Bir dizin belirtilirse, dizindeki tüm dosyalar yüklenir. Bir dosya belirtilirse, yalnızca tek bir dosya yüklenir. Ayrıca deyimi LOAD DATA isteğe bağlı bir bölüm belirtimi alır. Bir bölüm belirtildiğinde, veri dosyaları (giriş kaynağı bir dizin olduğunda) veya tek dosya (giriş kaynağı bir dosya olduğunda) hedef tablonun bölümüne yüklenir.

Tablo önbelleğe alınırsa, komut tablonun önbelleğe alınmış verilerini ve ona başvuran tüm bağımlılarını temizler. Tabloya veya bağımlılara bir sonraki sefer erişildiğinde önbellek gevşek olarak doldurulur.

Sözdizimi

LOAD DATA [ LOCAL ] INPATH path [ OVERWRITE ] INTO TABLE table_name [ PARTITION clause ]

Parametreler

  • yol

    Dosya sisteminin yolu. Mutlak veya göreli bir yol olabilir.

  • table_name

    Eklenecek tabloyu tanımlar. Ad bir zamansal belirtim içermemelidir. Tablo bulunamazsa Azure Databricks bir TABLE_OR_VIEW_NOT_FOUND hatası oluşturur.

  • PARTITION yan tümcesi

    Ekleme için bir hedef bölüm belirten isteğe bağlı bir parametre. Ayrıca bölümü yalnızca kısmen belirtebilirsiniz.

  • YÖRESEL

    Belirtilirse, genellikle dağıtılmış bir depolama alanı olan varsayılan dosya sistemi yerine yerel dosya sistemine karşı çözümlenmesine neden olur INPATH .

  • ÜZERİNE

    Varsayılan olarak, tabloya yeni veriler eklenir. Kullanılırsa OVERWRITE , tablonun üzerine yeni veriler yazılır.

Örnekler

-- Example without partition specification.
-- Assuming the students table has already been created and populated.
> SELECT * FROM students;
      name                address student_id
 --------- ---------------------- ----------
 Amy Smith 123 Park Ave, San Jose     111111

> CREATE TABLE test_load (name VARCHAR(64), address VARCHAR(64), student_id INT) USING HIVE;

-- Assuming the students table is in '/user/hive/warehouse/'
> LOAD DATA LOCAL INPATH '/user/hive/warehouse/students' OVERWRITE INTO TABLE test_load;

> SELECT * FROM test_load;
      name                address student_id
 --------- ---------------------- ----------
 Amy Smith 123 Park Ave, San Jose     111111

-- Example with partition specification.
> CREATE TABLE test_partition (c1 INT, c2 INT, c3 INT) PARTITIONED BY (c2, c3);

> INSERT INTO test_partition PARTITION (c2 = 2, c3 = 3) VALUES (1);

> INSERT INTO test_partition PARTITION (c2 = 5, c3 = 6) VALUES (4);

> INSERT INTO test_partition PARTITION (c2 = 8, c3 = 9) VALUES (7);

> SELECT * FROM test_partition;
  c1  c2  c3
 --- --- ---
   1   2   3
   4   5   6
   7   8   9

> CREATE TABLE test_load_partition (c1 INT, c2 INT, c3 INT) USING HIVE PARTITIONED BY (c2, c3);

-- Assuming the test_partition table is in '/user/hive/warehouse/'
> LOAD DATA LOCAL INPATH '/user/hive/warehouse/test_partition/c2=2/c3=3'
      OVERWRITE INTO TABLE test_load_partition PARTITION (c2=2, c3=3);

> SELECT * FROM test_load_partition;
  c1  c2  c3
 --- --- ---
   1   2   3