หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
ในบทช่วยสอนนี้ คุณจะกําหนดค่าฐานข้อมูลมิเรอร์ Fabric จาก Google BigQuery
Note
แม้ว่าตัวอย่างนี้จะเฉพาะเจาะจงสําหรับ BigQuery แต่คุณก็ดูขั้นตอนโดยละเอียดในการกําหนดค่าการมิเรอร์สําหรับแหล่งข้อมูลอื่นๆ เช่น ฐานข้อมูล Azure SQL หรือ Azure Cosmos DB ได้ สําหรับข้อมูลเพิ่มเติม ดู ที่ มิลเลอร์ใน Fabric คืออะไร
ข้อกําหนดเบื้องต้น
- สร้างหรือใช้คลังสินค้า BigQuery ที่มีอยู่ คุณเชื่อมต่อกับอินสแตนซ์ BigQuery เวอร์ชันใดก็ได้ในระบบคลาวด์ใดก็ได้ รวมถึง Microsoft Azure
- คุณต้องมีความจุ Fabric ที่มีอยู่ หากคุณไม่ทําเช่นนี้ ให้ เริ่มการทดลองใช้ Fabric
ข้อกําหนดสิทธิ์
คุณต้องมีสิทธิ์ของผู้ใช้สําหรับฐานข้อมูล BigQuery ที่มีสิทธิ์ต่อไปนี้
bigquery.datasets.createbigquery.tables.listbigquery.tables.createbigquery.tables.exportbigquery.tables.getbigquery.tables.getDatabigquery.tables.updateDatabigquery.routines.getbigquery.routines.listbigquery.jobs.createstorage.buckets.createstorage.buckets.liststorage.objects.createstorage.objects.deletestorage.objects.listiam.serviceAccounts.signBlob
ดึงข้อมูลเมตาของตารางและการกําหนดค่าประวัติการเปลี่ยนแปลง (จําเป็น)
บทบาท BigQueryAdmin และ StorageAdmin ควรมีสิทธิ์เหล่านี้ จําเป็นต้องมีสิทธิ์ต่อไปนี้เพื่อพิจารณาว่ามีการเปิดใช้งานประวัติการเปลี่ยนแปลงหรือไม่ และเพื่อดึงข้อมูลคีย์หลักหรือคีย์คอมโพสิต
ผู้ใช้ต้องมีบทบาทอย่างน้อย 1 บทบาทที่อนุญาตให้เข้าถึงอินสแตนซ์ BigQuery ตรวจสอบข้อกําหนดของระบบเครือข่ายเพื่อเข้าถึงแหล่งข้อมูล BigQuery หากคุณกําลังใช้การมิเรอร์สําหรับ Google BigQuery สําหรับเกตเวย์ข้อมูลภายในองค์กร (OPDG) คุณต้องมี OPDG เวอร์ชัน 3000.286.6 ขึ้นไปจึงจะเปิดใช้การมิเรอร์ได้สําเร็จ
สิทธิ์ที่จําเป็น
หากต้องการสร้างบัคเก็ตด้วยตนเอง (และไม่ต้องให้สิทธิ์ storage.buckets.create ) คุณสามารถใช้:
bigquery.tables.getbigquery.tables.listbigquery.routines.getbigquery.routines.list
- ไปที่ Cloud Storage ภายใน Google Console แล้วเลือกที่เก็บข้อมูล
- เลือก สร้าง และตั้งชื่อบัคเก็ตในรูปแบบนี้ (คํานึงถึงตัวพิมพ์เล็กและใหญ่):
<projectid>_fabric_staging_bucket - ตรวจสอบให้แน่ใจว่าตําแหน่ง/ภูมิภาคของบัคเก็ตเหมือนกับโปรเจ็กต์ GCP ที่คุณวางแผนจะมิเรอร์
- เลือก สร้าง ระบบมิเรอร์จะตรวจจับบัคเก็ตโดยอัตโนมัติ
อาจต้องมีสิทธิ์เพิ่มเติมขึ้นอยู่กับกรณีการใช้งานของคุณ สิทธิ์ขั้นต่ําที่จําเป็นมีไว้สําหรับการทํางานกับประวัติการเปลี่ยนแปลงและการจัดการตารางขนาดต่างๆ (ตารางที่มีขนาดใหญ่กว่า 10GB) แม้ว่าคุณจะไม่ได้ทํางานกับตารางที่มีขนาดใหญ่กว่า 10GB ให้เปิดใช้งานสิทธิ์ขั้นต่ําทั้งหมดเหล่านี้เพื่อเปิดใช้งานการใช้งานการมิเรอร์ของคุณให้ประสบความสําเร็จ
ดึงข้อมูลประวัติการเปลี่ยนแปลงและข้อมูลตาราง (จําเป็น)
สําหรับข้อมูลเพิ่มเติมเกี่ยวกับสิทธิ์ โปรดดูเอกสารประกอบของ Google BigQuery เกี่ยวกับ สิทธิ์ที่จําเป็นสําหรับการสตรีมข้อมูล สิทธิ์ ที่จําเป็นสําหรับการเข้าถึงประวัติการเปลี่ยนแปลง และ สิทธิ์ที่จําเป็นสําหรับการเขียนผลลัพธ์การค้นหา
จําเป็นต้องมีสิทธิ์ต่อไปนี้เพื่ออ่านประวัติการเปลี่ยนแปลงและข้อมูลตาราง
สําคัญ
การรักษาความปลอดภัยแบบละเอียดใดๆ ที่สร้างขึ้นในคลังสินค้า BigQuery ต้นทางต้องได้รับการกําหนดค่าใหม่ในฐานข้อมูลมิเรอร์ใน Microsoft Fabric สําหรับข้อมูลเพิ่มเติม ดูสิทธิ์ระดับแยกย่อยของ SQL ใน Microsoft Fabric
สิทธิ์ที่จําเป็น
bigquery.tables.getDatabigquery.jobs.createbigquery.jobs.getbigquery.jobs.listbigquery.readsessions.createbigquery.readsessions.getData
การเปิดใช้งานความสามารถของประวัติการเปลี่ยนแปลง (จําเป็น)
ต้องเปิดใช้ประวัติการเปลี่ยนแปลงในตาราง BigQuery ต้นทางโดยใช้ตัวเลือก ใดตัวเลือกหนึ่ง ต่อไปนี้
ตัวเลือกที่ 1: เปิดใช้งานการอนุญาต
bigquery.tables.update
อนุญาตให้เปิดใช้งานประวัติการเปลี่ยนแปลงบนตาราง
ตัวเลือกที่ 2: เปิดใช้ตัวเลือกตารางใน GCP
ตรวจสอบให้แน่ใจว่าได้ตั้งค่าตัวเลือกตารางต่อไปนี้เป็น TRUE:
enable_change_history
ส่งออกข้อมูลไปยัง Google Cloud Storage เพื่อจัดเตรียมและคัดลอกไปยัง OneLake (จําเป็น)
จําเป็นต้องมีสิทธิ์ต่อไปนี้เพื่อส่งออกข้อมูล BigQuery ไปยัง Google Cloud Storage เพื่อจัดเตรียมและคัดลอกไปยัง OneLake
สิทธิ์ที่จําเป็น
bigquery.tables.exportstorage.objects.createstorage.objects.liststorage.buckets.getiam.serviceAccounts.signBlob
ที่เก็บข้อมูล Google Cloud Storage สําหรับการจัดเตรียม (จําเป็น)
ต้องใช้ที่เก็บข้อมูล Google Cloud Storage เพื่อส่งออกข้อมูลตาราง BigQuery สําหรับการจัดเตรียม
ตัวเลือกการสร้างถัง
ใช้วิธีใด วิธีหนึ่ง ต่อไปนี้:
ตัวเลือกที่ 1: อนุญาตให้สร้างบัคเก็ตอัตโนมัติ
ให้สิทธิ์ต่อไปนี้:
storage.buckets.create
ตัวเลือกที่ 2: สร้างบัคเก็ตการแสดงละครด้วยตนเอง
สร้างบัคเก็ตด้วยแบบแผนการตั้งชื่อต่อไปนี้: <your_project_id_in_lowercase>_fabric_staging_bucket
ข้อกําหนดของถัง
- ที่เก็บข้อมูลต้องอยู่ในตําแหน่ง/ภูมิภาคเดียวกันกับชุดข้อมูล BigQuery
- ระบบมิเรอร์จะตรวจจับบัคเก็ตโดยอัตโนมัติเมื่อมีอยู่
รายการชุดข้อมูล (จําเป็น)
สิทธิ์ที่จําเป็น
bigquery.datasets.get
รายการโครงการ (จําเป็น)
สิทธิ์ที่จําเป็น
resourcemanager.projects.get
บทบาทและข้อกําหนดการเข้าถึง
โดยทั่วไปบทบาท ผู้ดูแลระบบ BigQuery และ ผู้ดูแลระบบพื้นที่เก็บข้อมูล จะมีสิทธิ์ที่ระบุไว้ข้างต้น
ผู้ใช้ต้องได้รับมอบหมายบทบาทอย่างน้อย 1 บทบาทที่ให้สิทธิ์เข้าถึงโปรเจ็กต์ BigQuery เป้าหมายและชุดข้อมูล
ข้อกําหนดด้านเครือข่ายและเกตเวย์
ตรวจสอบข้อกําหนดของระบบเครือข่ายเพื่อเข้าถึงแหล่งข้อมูล BigQuery
หากคุณกําลังใช้ การมิเรอร์สําหรับ Google BigQuery กับเกตเวย์ข้อมูลในองค์กร (OPDG) คุณต้องใช้สิ่งต่อไปนี้
- OPDG เวอร์ชัน 3000.286.6 หรือใหม่กว่า
หมายเหตุเพิ่มเติม
อาจต้องมีสิทธิ์เพิ่มเติมขึ้นอยู่กับกรณีการใช้งานของคุณ สิทธิ์ที่ระบุไว้ข้างต้นแสดงถึงขั้นต่ํา ที่จําเป็น สําหรับ:
- การทํางานกับประวัติการเปลี่ยนแปลง
- โต๊ะจัดการขนาดต่างๆ รวมถึงโต๊ะที่มีขนาดใหญ่กว่า 10 GB
แม้ว่าคุณจะไม่ได้ทํางานกับตารางที่มีขนาดใหญ่กว่า 10 GB แต่ขอแนะนําให้เปิดใช้งานสิทธิ์ขั้นต่ําทั้งหมดเพื่อให้แน่ใจว่าการมิเรอร์จะสําเร็จ
สำหรับข้อมูลเพิ่มเติม โปรดดู:
- สิทธิ์ที่จําเป็นสําหรับข้อมูลสตรีมมิ่ง
- สิทธิ์ที่จําเป็นสําหรับการเข้าถึงประวัติการเปลี่ยนแปลง
- สิทธิ์ที่จําเป็นสําหรับการเขียนผลลัพธ์แบบสอบถาม
สําคัญ
การรักษาความปลอดภัยแบบละเอียดใดๆ ที่กําหนดไว้ในคลังสินค้า BigQuery ต้นทางต้องได้รับการกําหนดค่าใหม่ในฐานข้อมูลมิเรอร์ใน Microsoft Fabric สําหรับข้อมูลเพิ่มเติม ดูสิทธิ์ระดับแยกย่อยของ SQL ใน Microsoft Fabric
สร้างฐานข้อมูลที่มิเรอร์
ในส่วนนี้ คุณจะสร้างฐานข้อมูลมิเรอร์ใหม่จากแหล่งข้อมูล BigQuery ที่มิเรอร์
คุณสามารถใช้พื้นที่ทํางานที่มีอยู่ (ไม่ใช่พื้นที่ทํางานของฉัน) หรือสร้างพื้นที่ทํางานใหม่
- จากพื้นที่ทํางานของคุณ ให้ไปที่ฮับสร้าง
- หลังจากที่คุณเลือกพื้นที่ทํางานที่คุณต้องการใช้ ให้เลือก สร้าง
- เลือกการ์ด Google BigQuery ที่มิเรอร์
- ป้อนชื่อสําหรับฐานข้อมูลใหม่
- เลือก สร้าง
เชื่อมต่อกับอินสแตนซ์ BigQuery ในระบบคลาวด์ใดก็ได้
Note
คุณอาจต้องแก้ไขไฟร์วอลล์ระบบคลาวด์เพื่อให้การมิเรอร์เชื่อมต่อกับอินสแตนซ์ BigQuery ได้ เรารองรับการมิเรอร์สําหรับ Google BigQuery สําหรับ OPDG เวอร์ชัน 3000.286.6 ขึ้นไป เรายังสนับสนุน VNET
เลือก BigQuery ในส่วน การเชื่อมต่อใหม่ หรือเลือกการเชื่อมต่อที่มีอยู่
หากเลือก การเชื่อมต่อใหม่ ให้ป้อนรายละเอียดการเชื่อมต่อกับฐานข้อมูล BigQuery
การตั้งค่าการเชื่อมต่อ คำอธิบาย อีเมลบัญชีบริการ หากคุณมีบัญชีบริการอยู่แล้ว ให้ค้นหาอีเมลของบัญชีบริการและคีย์ที่มีอยู่ได้โดยไปที่ บัญชีบริการ ในคอนโซล Google BigQuery หากไม่มีบัญชีบริการอยู่แล้ว ให้ไปที่ "บัญชีบริการ" ในคอนโซล Google BigQuery แล้วเลือกสร้างบัญชีบริการ ป้อนชื่อบัญชีบริการ (รหัสบัญชีบริการจะถูกสร้างขึ้นโดยอัตโนมัติตามชื่อบัญชีบริการที่คุณป้อน) และคําอธิบายบัญชีบริการ เลือก เสร็จสิ้น คัดลอกและวางอีเมลบัญชีบริการลงในส่วนข้อมูลประจําตัวการเชื่อมต่อที่กําหนดใน Fabric เนื้อหาไฟล์คีย์ JSON ของบัญชีบริการ ภายในแดชบอร์ดบัญชีบริการ ให้เลือก การดําเนินการ สําหรับบัญชีบริการที่สร้างขึ้นใหม่ของคุณ เลือกจัดการคีย์ หากคุณมีคีย์ต่อบัญชีบริการอยู่แล้ว ให้ดาวน์โหลดเนื้อหาไฟล์คีย์ JSON
หากยังไม่มีคีย์ต่อบัญชีบริการ ให้เลือกเพิ่มคีย์และสร้างคีย์ใหม่ จากนั้นเลือก JSON ไฟล์คีย์ JSON ควรดาวน์โหลดโดยอัตโนมัติ คัดลอกและวางคีย์ JSON ลงในส่วนข้อมูลประจําตัวการเชื่อมต่อที่กําหนดในพอร์ทัล Fabricการเชื่อมต่อ สร้างการเชื่อมต่อใหม่ ชื่อการเชื่อมต่อ ควรกรอกโดยอัตโนมัติ เปลี่ยนเป็นชื่อที่คุณต้องการใช้ เลือกฐานข้อมูลจากรายการแบบเลื่อนลง
เริ่มกระบวนการมิเรอร์
หน้าจอ กําหนดค่าการ มิเรอร์ช่วยให้คุณสามารถมิเรอร์ข้อมูลทั้งหมดในฐานข้อมูลตามค่าเริ่มต้น
มิเรอร์ข้อมูล ทั้งหมดหมายความว่าตารางใหม่ใด ๆ ที่สร้างขึ้นหลังจากการมิเรอร์เริ่มต้นจะสะท้อน
อีกทางหนึ่งคือเลือกเฉพาะวัตถุบางอย่างเพื่อมิเรอร์ ปิดใช้งานตัวเลือก มิเรอร์ข้อมูลทั้งหมด จากนั้นเลือกแต่ละตารางจากฐานข้อมูลของคุณ
สําหรับตัวอย่างนี้ เราใช้ตัวเลือก มิเรอร์ข้อมูลทั้งหมด
เลือก ฐานข้อมูลมิเรอร์ การสะท้อนเริ่มต้น
รอ 2-5 นาที จากนั้นเลือก ตรวจสอบการ จําลองแบบ เพื่อดูสถานะ
หลังจากสองสามนาที สถานะควรเปลี่ยนเป็น กําลังทํางาน ซึ่งหมายความว่าตารางกําลังถูกซิงโครไนซ์
หากคุณไม่เห็นตารางและสถานะการจําลองแบบที่สอดคล้องกัน ให้รอสักครู่แล้วจึงรีเฟรชแผง
เมื่อเสร็จสิ้นการคัดลอกเริ่มต้นของตารางแล้ว วันที่จะปรากฏใน คอลัมน์ รีเฟรช ครั้งล่าสุด
ในตอนนี้ข้อมูลของคุณพร้อมใช้งาน แล้ว มีสถานการณ์การวิเคราะห์ต่าง ๆ ที่พร้อมใช้งานใน Fabric ทั้งหมด
สําคัญ
- การสะท้อนสําหรับ Google BigQuery มีความล่าช้าในการสะท้อนการเปลี่ยนแปลง ~15 นาที นี่เป็นข้อจํากัดจากความสามารถของประวัติการเปลี่ยนแปลงของ Google BigQuery
- การรักษาความปลอดภัยระดับแยกย่อยใด ๆ ที่สร้างขึ้นในฐานข้อมูลต้นฉบับต้องได้รับการกําหนดค่าใหม่ในฐานข้อมูลที่มิเรอร์ใน Microsoft Fabric
จอภาพการสะท้อนผ้า
เมื่อมีการกําหนดค่ามิเรอร์ แล้ว ระบบจะนําทางคุณไปยัง หน้า สถานะ การมิเรอร์ ที่นี่ คุณสามารถตรวจสอบสถานะปัจจุบันของการจําลองแบบได้
สําหรับข้อมูลเพิ่มเติมและรายละเอียดเกี่ยวกับสถานะการจําลองแบบ ดู ตรวจสอบการจําลองแบบฐานข้อมูลมิเรอร์ Fabric
สําคัญ
หากไม่มีการอัปเดตในตารางต้นทางในฐานข้อมูล BigQuery กลไกตัวจําลอง (กลไกที่ขับเคลื่อนข้อมูลการเปลี่ยนแปลงสําหรับการมิเรอร์ BigQuery) จะทํางานช้าลงและทําซ้ําตารางทุกชั่วโมงเท่านั้น อย่าแปลกใจหากข้อมูลหลังจากการโหลดครั้งแรกใช้เวลานานกว่าที่คาดไว้ โดยเฉพาะอย่างยิ่งหากคุณไม่มีการอัปเดตใหม่ในตารางต้นทางของคุณ หลังจากสแนปช็อต Mirror Engine จะรอ ~15 นาทีก่อนที่จะดึงข้อมูลการเปลี่ยนแปลง นี่เป็นเพราะข้อจํากัดจาก Google BigQuery ซึ่งกําหนดให้มีการหน่วงเวลา 10 นาทีในการสะท้อนการเปลี่ยนแปลงใหม่ๆ ดูข้อมูลเพิ่มเติมเกี่ยวกับความล่าช้าในการสะท้อนการเปลี่ยนแปลงของ BigQuery