แชร์ผ่าน


ขนาดเกตเวย์ข้อมูลภายในองค์กร

บทความนี้มีเป้าหมายเป็นผู้ดูแลระบบ Power BI ที่จําเป็นต้องติดตั้งและจัดการ เกตเวย์ข้อมูลภายในองค์กร

จําเป็นต้องใช้เกตเวย์เมื่อ Power BI ต้องเข้าถึงข้อมูลที่ไม่สามารถใช้งานได้โดยตรงผ่านทางอินเทอร์เน็ต สามารถติดตั้งได้บนเซิร์ฟเวอร์ภายในองค์กร หรือโครงสร้างพื้นฐานที่เป็นโฮสต์ของ VM ในฐานะบริการ (IaaS)

ปริมาณงานเกตเวย์

เกตเวย์ข้อมูลภายในองค์กรสนับสนุนปริมาณงานสองตัว เป็นสิ่งสําคัญที่คุณต้องทําความเข้าใจปริมาณงานเหล่านี้ก่อนที่เราจะพูดคุยเกี่ยวกับการปรับขนาดเกตเวย์และคําแนะนํา

ปริมาณงานข้อมูลที่แคช

ปริมาณ งานข้อมูลที่ แคชไว้ดึงและแปลงแหล่งข้อมูลต้นทางสําหรับการโหลดลงในแบบจําลองความหมายของ Power BI ดําเนินการดังกล่าวได้ในสามขั้นตอน:

  1. การเชื่อมต่อ: เกตเวย์เชื่อมต่อกับข้อมูลต้นทาง
  2. การเรียกและการแปลงข้อมูล: ข้อมูลจะถูกเรียกใช้ และเมื่อจําเป็น จะถูกแปลง เมื่อใดก็ตามที่เป็นไปได้ กลไกการผสมเข้าด้วยกันของ Power Query จะส่งขั้นตอนการแปลงไปยังแหล่งข้อมูล - ซึ่งเรียกว่า การพับคิวรี เมื่อไม่สามารถทําได้ การแปลงจะต้องดําเนินการโดยเกตเวย์ ในกรณีนี้ เกตเวย์จะใช้ทรัพยากร CPU และหน่วยความจํามากขึ้น
  3. ถ่ายโอน: ข้อมูลถูกถ่ายโอนไปยังบริการของ Power BI — การเชื่อมต่ออินเทอร์เน็ตที่เชื่อถือได้และรวดเร็วเป็นสิ่งสําคัญโดยเฉพาะอย่างยิ่งสําหรับจํานวนข้อมูลขนาดใหญ่

แผนผังของข้อมูลแคชที่แสดงเกตเวย์ข้อมูลภายในองค์กรที่เชื่อมต่อกับแหล่งข้อมูลภายในองค์กร

ปริมาณงานการเชื่อมต่อสดและ DirectQuery

ปริมาณ งานการเชื่อมต่อสดและ DirectQuery ส่วนใหญ่จะทํางานในโหมดพาส-ทรู บริการของ Power BI ส่งคิวรีและเกตเวย์ตอบสนองกับผลลัพธ์คิวรี โดยทั่วไป ผลลัพธ์ของคิวรีจะมีขนาดเล็ก

ปริมาณงานนี้จําเป็นต้องใช้ทรัพยากรของ CPU สําหรับคิวรีของเส้นทางและผลลัพธ์คิวรี โดยปกติแล้วจะมีความต้องการ CPU น้อยกว่าปริมาณการแคชข้อมูลที่จําเป็น โดยเฉพาะอย่างยิ่งเมื่อจําเป็นต้องแปลงข้อมูลสําหรับการแคช

การเชื่อมต่อที่เชื่อถือได้ รวดเร็ว และสม่ําเสมอเป็นสิ่งสําคัญที่ต้องตรวจสอบให้แน่ใจว่าผู้ใช้รายงานมีประสบการณ์ตอบสนอง

แผนผังของการเชื่อมต่อสดและ DirectQuery ที่แสดงเกตเวย์ข้อมูลภายในองค์กรที่เชื่อมต่อกับแหล่งข้อมูลภายในองค์กร

ข้อควรพิจารณาเกี่ยวกับการปรับขนาด

การกําหนดขนาดที่ถูกต้องสําหรับเครื่องเกตเวย์ของคุณอาจขึ้นอยู่กับตัวแปรต่อไปนี้:

  • สําหรับปริมาณงานของข้อมูลแคช:
    • จํานวนการรีเฟรชแบบจําลองความหมายพร้อมกัน
    • ชนิดของแหล่งข้อมูล (ฐานข้อมูลเชิงสัมพันธ์ ฐานข้อมูลการวิเคราะห์ ฟีดข้อมูล หรือไฟล์)
    • ปริมาณข้อมูลที่จะเรียกใช้จากแหล่งข้อมูล
    • การแปลงใดๆ ที่จําเป็นต้องทําโดย Power Query mashup engine
    • ปริมาณของข้อมูลที่จะถ่ายโอนไปยังบริการของ Power BI
  • สําหรับปริมาณงานการเชื่อมต่อสดและ DirectQuery:
    • จํานวนผู้ใช้รายงานที่เกิดขึ้นพร้อมกัน
    • จํานวนวิชวลบนหน้ารายงาน (แต่ละวิชวลจะส่งอย่างน้อยหนึ่งคิวรี)
    • ความถี่ของการอัปเดตแคชคิวรีของแดชบอร์ด Power BI
    • จํานวนรายงานแบบเรียลไทม์โดยใช้คุณลักษณะการ รีเฟรช หน้าอัตโนมัติ
    • ไม่ว่าแบบจําลองความหมายจะบังคับใช้ การรักษาความปลอดภัยระดับแถว (RLS) หรือไม่

โดยทั่วไปแล้ว ปริมาณงานการเชื่อมต่อสดและ DirectQuery จําเป็นต้องมี CPU เพียงพอ ในขณะที่ปริมาณงานแคชข้อมูลจําเป็นต้องใช้ CPU และหน่วยความจํามากขึ้น ปริมาณงานทั้งสองขึ้นอยู่กับการเชื่อมต่อที่ดีกับบริการของ Power BI และแหล่งข้อมูล

หมายเหตุ

ความจุ Power BI กําหนดขีดจํากัดในการรีเฟรชแบบจําลองแบบขนาน และอัตราความเร็วการเชื่อมต่อสดและ DirectQuery การปรับขนาดของเกตเวย์ของคุณเพื่อส่งข้อมูลมากกว่าที่บริการของ Power BI สนับสนุนไม่ได้ส่งผลใดๆ เลย ขีดจํากัดมีความแตกต่างตาม Premium SKU (และ SKU ที่มีขนาดเท่ากัน) สําหรับข้อมูลเพิ่มเติม โปรดดูสิทธิ์การใช้งานความจุ Microsoft Fabric และ Power BI Premium คืออะไร (โหนดความจุ)

สำคัญ

ในบางครั้งที่บทความนี้อ้างอิงถึง Power BI Premium หรือการสมัครใช้งานความจุ (P SKU) โปรดทราบว่าในขณะนี้ Microsoft กําลังรวมตัวเลือกการซื้อและหยุดใช้งาน Power BI Premium ต่อความจุ SKU ลูกค้าใหม่และลูกค้าที่มีอยู่ควรพิจารณาซื้อการสมัครใช้งานความจุ Fabric (F SKU) แทน

สําหรับข้อมูลเพิ่มเติม โปรดดู ที่ การอัปเดตที่สําคัญเกี่ยวกับการให้สิทธิ์การใช้งาน Power BI Premium และ คําถามที่ถามบ่อยของ Power BI Premium

คำแนะนำ

คําแนะนําในการปรับขนาดเกตเวย์ขึ้นอยู่กับตัวแปรจํานวนมาก ในส่วนนี้ เราจะให้คําแนะนําทั่วไปที่คุณสามารถนําไปพิจารณาดูได้

การปรับขนาดเริ่มต้น

อาจเป็นเรื่องยากที่จะประเมินขนาดที่ถูกต้องได้อย่างแม่นยํา เราขอแนะนําให้คุณเริ่มต้นด้วยเครื่องที่มีแกน CPU อย่างน้อย 8 แกน RAM 8 GB และอะแดปเตอร์เครือข่ายหลายกิกะบิต จากนั้นคุณสามารถวัดปริมาณงานเกตเวย์ทั่วไปได้โดยการบันทึกตัวนับของ CPU และหน่วยความจําระบบ สําหรับข้อมูลเพิ่มเติม ให้ดู การตรวจสอบและปรับประสิทธิภาพการทํางานของเกตเวย์ข้อมูลภายในองค์กรให้เหมาะสม

การเชื่อมต่อ

วางแผนสําหรับการเชื่อมต่อที่ดีที่สุดที่เป็นไปได้ระหว่างบริการของ Power BI กับเกตเวย์ของคุณ และเกตเวย์ของคุณกับแหล่งข้อมูล

  • มุ่งมั่นเพื่อความน่าเชื่อถือ ความรวดเร็ว และเวลาในการตอบสนองที่ต่ําและสม่ําเสมอ
  • กําจัด - หรือลด - การกระโดดของเครื่องระหว่างเกตเวย์และแหล่งข้อมูลของคุณ
  • ลบการควบคุมเครือข่ายใดๆ ที่กําหนดโดยเลเยอร์พร็อกซีไฟร์วอลล์ของคุณ สําหรับข้อมูลเพิ่มเติมเกี่ยวกับจุดสิ้นสุด Power BI ดู เพิ่ม URL Power BI ในรายการอนุญาตของคุณ
  • ตั้งค่า Azure ExpressRoute เพื่อสร้างการเชื่อมต่อส่วนตัวที่มีการจัดการไปยัง Power BI
  • สําหรับแหล่งข้อมูลใน Azure VM ตรวจสอบให้แน่ใจว่า VMs colocated กับบริการของ Power BI
  • สําหรับปริมาณงานการเชื่อมต่อสดไปยัง SQL Server Analysis Services (SSAS) ที่เกี่ยวข้องกับ RLS แบบไดนามิก ตรวจสอบให้แน่ใจว่ามีการเชื่อมต่อที่ดีระหว่างเครื่องเกตเวย์และ Active Directory ในองค์กร

การจัดกลุ่มคลัสเตอร์

สําหรับการปรับใช้ขนาดใหญ่ คุณสามารถสร้างเกตเวย์ที่มีสมาชิกคลัสเตอร์หลายราย คลัสเตอร์หลีกเลี่ยงจุดเดียวของความล้มเหลว และสามารถโหลดการรับส่งข้อมูลสมดุลข้ามเกตเวย์ คุณสามารถ:

  • ติดตั้งเกตเวย์อย่างน้อยหนึ่งรายการในคลัสเตอร์
  • แยกปริมาณงานไปยังเกตเวย์แบบสแตนด์อโลนหรือคลัสเตอร์ของเซิร์ฟเวอร์เกตเวย์

สําหรับข้อมูลเพิ่มเติม โปรดดู จัดการคลัสเตอร์เกตเวย์ข้อมูลภายในองค์กรที่มีความพร้อมใช้งานสูงและการปรับสมดุลการโหลด

การออกแบบและการตั้งค่าแบบจําลองความหมาย

การออกแบบแบบจําลองความหมายและการตั้งค่าอาจส่งผลกระทบต่อปริมาณงานเกตเวย์ หากต้องการลดปริมาณงานเกตเวย์ คุณสามารถพิจารณาการดําเนินการต่อไปนี้

สําหรับแบบจําลองความหมายที่นําเข้า:

  • ตั้งค่าการรีเฟรชข้อมูลน้อยลง
  • ตั้งค่า การรีเฟรช แบบเพิ่มหน่วยเพื่อลดจํานวนข้อมูลที่จะถ่ายโอน
  • เมื่อใดก็ตามที่เป็นไปได้ ให้ตรวจสอบให้แน่ใจว่า มีการ พับคิวรีเกิดขึ้น
  • โดยเฉพาะอย่างยิ่งสําหรับข้อมูลขนาดใหญ่หรือความจําเป็นสําหรับผลลัพธ์ที่มีเวลาแฝงต่ํา ให้แปลงการออกแบบเป็นแบบจําลอง DirectQuery หรือแบบรวม

สําหรับแบบจําลองความหมาย DirectQuery:

  • ปรับแหล่งข้อมูล แบบจําลอง และการออกแบบรายงานให้เหมาะสม สําหรับข้อมูลเพิ่มเติม ดู คําแนะนําแบบจําลอง DirectQuery ใน Power BI Desktop
  • สร้าง การรวม เพื่อแคชผลลัพธ์ในระดับที่สูงขึ้นเพื่อลดจํานวนคําขอ DirectQuery
  • จํากัด ช่วงเวลาการรีเฟรช หน้าอัตโนมัติในการออกแบบรายงานและการตั้งค่าความจุ
  • โดยเฉพาะอย่างยิ่งเมื่อบังคับใช้ RLS แบบไดนามิก ให้จํากัดความถี่ในการอัปเดตแคชของแดชบอร์ด
  • โดยเฉพาะอย่างยิ่งสําหรับข้อมูลที่มีขนาดเล็กหรือสําหรับข้อมูลที่ไม่เปลี่ยนแปลง ให้แปลงการออกแบบเป็นแบบจําลองการนําเข้าหรือแบบรวม

สําหรับแบบจําลองความหมายการเชื่อมต่อสด:

  • โดยเฉพาะอย่างยิ่งเมื่อบังคับใช้ RLS แบบไดนามิก ให้จํากัดความถี่ในการอัปเดตแคชของแดชบอร์ด

สําหรับข้อมูลเพิ่มเติมที่เกี่ยวข้องกับบทความนี้ โปรดดูทรัพยากรต่อไปนี้: