إدراج OVERWRITE DIRECTORY بتنسيق Hive

ينطبق على: وضع علامة Databricks Runtime

الكتابة فوق البيانات الموجودة في الدليل مع القيم الجديدة باستخدام Hive SerDe. يجب تمكين دعم Hive لاستخدام هذا الأمر. يمكنك تحديد الصفوف المدرجة حسب تعبيرات القيمة أو نتيجة استعلام.

بناء الجملة

INSERT OVERWRITE [ LOCAL ] DIRECTORY directory_path
    [ ROW FORMAT row_format ] [ STORED AS file_format ]
    { VALUES ( { value | NULL } [ , ... ] ) [ , ( ... ) ] | query }

المعلمات

  • directory_path

    الدليل الوجهة. LOCAL تحدد الكلمة الأساسية أن الدليل موجود على نظام الملفات المحلي.

  • row_format

    تنسيق الصف لهذا الإدراج. الخيارات الصالحة هي SERDE عبارة وعبارة DELIMITED . SERDE يمكن استخدام عبارة لتحديد مخصص SerDe لهذا الإدراج. بدلا من ذلك، DELIMITED يمكن استخدام العبارة لتحديد المحدد الأصلي SerDe وحالة المحدد وحرف الإلغاء والحرف الفارغ وما إلى ذلك.

  • file_format

    تنسيق الملف لهذا الإدراج. الخيارات الصالحة هي TEXTFILEو RCFILESEQUENCEFILEوORCPARQUET.AVRO يمكنك أيضا تحديد تنسيق الإدخال والإخراج الخاص بك باستخدام INPUTFORMAT و OUTPUTFORMAT. ROW FORMAT SERDEيمكن استخدام فقط مع TEXTFILE، أو ، بينما RCFILEROW FORMAT DELIMITED يمكن استخدام فقط مع TEXTFILESEQUENCEFILE.

  • VALUES ( { value | NULL } [ , ... ] ) [ , ( … ) ]

    القيم المراد إدراجها. يمكن إدراج قيمة محددة بشكل صريح أو NULL. يجب استخدام فاصلة لفصل كل قيمة في عبارة . يمكن تحديد أكثر من مجموعة واحدة من القيم لإدراج صفوف متعددة.

  • الاستعلام

    استعلام ينتج الصفوف المراد إدراجها. أحد التنسيقات التالية:

    • عبارة SELECT
    • عبارة TABLE
    • عبارة FROM

الأمثلة

INSERT OVERWRITE LOCAL DIRECTORY '/tmp/destination'
    STORED AS orc
    SELECT * FROM test_table;

INSERT OVERWRITE LOCAL DIRECTORY '/tmp/destination'
    ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
    SELECT * FROM test_table;