รับข้อมูลจาก OneLake

บทความ
12/24/2024

ในบทความนี้ คุณจะได้เรียนรู้วิธีการรับข้อมูลจาก OneLake ลงในตารางใหม่หรือตารางที่มีอยู่

ข้อกําหนดเบื้องต้น

พื้นที่ทํางาน ที่มีความจุ ที่เปิดใช้งาน Microsoft Fabric
เลคเฮาส์
ฐานข้อมูล KQL ที่มีสิทธิ์ในการแก้ไข

คัดลอกเส้นทางไฟล์จากเลคเฮ้าส์

จากพื้นที่ทํางานของคุณ เลือกสภาพแวดล้อม Lakehouse ที่มีแหล่งข้อมูลที่คุณต้องการใช้
วางเคอร์เซอร์ของคุณเหนือไฟล์ที่ต้องการ และเลือกเมนู เพิ่มเติม (...) จากนั้นเลือก คุณสมบัติ
สําคัญ
- ไม่รองรับเส้นทางโฟลเดอร์
- ไม่รองรับสัญลักษณ์แทน (*)
ภายใต้ URLให้เลือกไอคอน คัดลอกไปยังคลิปบอร์ด และบันทึกไว้ในตําแหน่งที่ต้องการเรียกใช้ในภายหลัง
กลับไปยังพื้นที่ทํางานของคุณและเลือกฐานข้อมูล KQL

ที่มา

ที่ริบบิ้นด้านล่างของฐานข้อมูล KQL ให้เลือก รับข้อมูล

ในหน้าต่าง รับข้อมูล แท็บ แหล่งข้อมูล จะถูกเลือกไว้
เลือกแหล่งข้อมูลจากรายการที่พร้อมใช้งาน ในตัวอย่างนี้ คุณกําลังรวบรวมข้อมูลจาก OneLake

กําหนดค่า

เลือกตารางเป้าหมาย ถ้าคุณต้องการเก็บข้อมูลลงในตารางใหม่ เลือก + ตารางใหม่ และป้อนชื่อตาราง

โน้ต

ชื่อตารางสามารถมีได้ถึง 1024 อักขระ รวมถึงช่องว่าง พยัญชนะผสมตัวเลข เครื่องหมายยัติภังค์ และขีดล่าง ไม่รองรับอักขระพิเศษ
ใน ไฟล์ OneLakeวางเส้นทางไฟล์ของเลคเฮ้าส์ที่คุณคัดลอกในเส้นทางไฟล์ คัดลอกจาก Lakehouse

โน้ต

คุณสามารถเพิ่มขนาดที่ไม่มีการบีบอัดได้สูงสุด 10 รายการต่อขนาดสูงสุด 1 GB
เลือก ถัดไป

ตรวจ

แท็บ ตรวจสอบ จะเปิดขึ้นพร้อมกับแสดงตัวอย่างของข้อมูล

เลือก เสร็จสิ้นเพื่อเสร็จสิ้นกระบวนการการนําเข้าข้อมูล

เลือก:

เลือก Command viewer เพื่อดูและคัดลอกคําสั่งอัตโนมัติที่สร้างขึ้นจากการป้อนข้อมูลของคุณ
ใช้ไฟล์ข้อกําหนด Schema ดรอปดาวน์เพื่อเปลี่ยนไฟล์ที่มีการอนุมาน Schema
เปลี่ยนรูปแบบข้อมูลที่อนุมานโดยอัตโนมัติโดยการเลือกรูปแบบที่ต้องการจากดรอปดาวน์ สําหรับข้อมูลเพิ่มเติม ให้ดู รูปแบบข้อมูล ที่ได้รับการสนับสนุนโดย Real-Time Intelligence
แก้ไขคอลัมน์
สํารวจ ตัวเลือกขั้นสูงที่ยึดตามชนิดข้อมูล

แก้ไขคอลัมน์

โน้ต

สําหรับรูปแบบตาราง (CSV, TSV, PSV) คุณไม่สามารถแมปคอลัมน์สองครั้ง เมื่อต้องการแมปไปยังคอลัมน์ที่มีอยู่ ก่อนอื่นให้ลบคอลัมน์ใหม่
คุณไม่สามารถเปลี่ยนชนิดคอลัมน์ที่มีอยู่ได้ ถ้าคุณพยายามแมปไปยังคอลัมน์ที่มีรูปแบบที่แตกต่างกัน คุณอาจมีคอลัมน์ที่ว่างเปล่า

การเปลี่ยนแปลงที่คุณสามารถทําได้ในตารางขึ้นอยู่กับพารามิเตอร์ต่อไปนี้:

ชนิด ตาราง เป็นชนิดใหม่หรือที่มีอยู่
ชนิด การแมป เป็นชนิดใหม่หรือที่มีอยู่

ชนิดตาราง	ชนิดการแมป	การปรับปรุงที่พร้อมใช้งาน
ตารางใหม่	การแมปใหม่	เปลี่ยนชื่อคอลัมน์ เปลี่ยนชนิดข้อมูล เปลี่ยนแหล่งข้อมูล แมปเพิ่มคอลัมน์ ลบคอลัมน์
ตารางที่มีอยู่	การแมปใหม่	เพิ่มคอลัมน์ (ซึ่งคุณสามารถเปลี่ยนชนิดข้อมูล เปลี่ยนชื่อ และอัปเดต)
ตารางที่มีอยู่	การแมปที่มีอยู่	ไม่มีใคร

การแม็ปการแปลง

การแมปรูปแบบข้อมูลบางอย่าง (Parquet, JSON และ Avro) สนับสนุนการแปลงข้อมูล ingest-time แบบง่าย เมื่อต้องการใช้การแปลงการแมป ให้สร้างหรืออัปเดตคอลัมน์ในหน้าต่าง แก้ไขคอลัมน์

การแปลงข้อมูลการแมปสามารถทําได้ในคอลัมน์ของสตริงชนิดหรือวันที่เวลา ด้วยแหล่งข้อมูลที่มีชนิดข้อมูลเป็น int หรือ long การแปลงการแมปที่สนับสนุนคือ:

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

ตัวเลือกขั้นสูงที่ยึดตามชนิดข้อมูล

Tabular (CSV, TSV, PSV):

ถ้าคุณกําลังทําการนําเข้ารูปแบบตารางในตาราง ที่มีอยู่ คุณสามารถเลือก ขั้นสูง>รักษา schema ของตาราง ข้อมูลแบบตารางไม่จําเป็นต้องรวมชื่อคอลัมน์ที่ใช้ในการแมปข้อมูลต้นทางไปยังคอลัมน์ที่มีอยู่ เมื่อเลือกตัวเลือกนี้ การแมปจะดําเนินการตามลําดับ และ Schema ของตารางยังคงเหมือนเดิม ถ้าไม่ได้เลือกตัวเลือกนี้ คอลัมน์ใหม่จะถูกสร้างขึ้นสําหรับข้อมูลขาเข้าโดยไม่คํานึงถึงโครงสร้างข้อมูล
เมื่อต้องการใช้แถวแรกเป็นชื่อคอลัมน์ ให้เลือก ขั้นสูง>แถวแรกคือส่วนหัวของคอลัมน์

JSON :

เมื่อต้องการกําหนดการแบ่งคอลัมน์ของข้อมูล JSON ให้เลือก ระดับที่ซ้อนกันขั้นสูง>จาก 1 ถึง 100
ถ้าคุณเลือก ขั้นสูง>ข้ามบรรทัด JSON ที่มีข้อผิดพลาดข้อมูลจะถูกนําเข้าในรูปแบบ JSON ถ้าคุณยกเลิกการเลือกกล่องกาเครื่องหมายนี้ ระบบจะนําเข้าข้อมูลในรูปแบบ multijson

สรุป

ในหน้าต่าง การเตรียมข้อมูล ทั้งสามขั้นตอนจะถูกทําเครื่องหมายด้วยเครื่องหมายถูกสีเขียวเมื่อการนําเข้าข้อมูลเสร็จสิ้น คุณสามารถเลือกการ์ดที่จะคิวรี วางข้อมูลนําเข้า หรือดูแดชบอร์ดของสรุปการนําเข้าของคุณได้

ข้อมูลคิวรีใน คิวรี KQL
แสดงข้อมูลด้วยภาพในรายงาน Power BI

แชร์ผ่าน

รับข้อมูลจาก OneLake

ข้อกําหนดเบื้องต้น

คัดลอกเส้นทางไฟล์จากเลคเฮ้าส์

ที่มา

กําหนดค่า