Helyszíni adatátjáró méretezése

Ez a cikk azoknak a Power BI-rendszergazdáknak szól, akiknek helyszíni adatátjárót kell telepíteniük és felügyelniük.

Az átjáróra akkor van szükség, ha a Power BI-nak az interneten közvetlenül nem elérhető adatokhoz kell hozzáférnie. Telepíthető helyszíni kiszolgálóra, vagy virtuális gépen üzemeltetett szolgáltatott infrastruktúrára (IaaS).

Az átjáró feladatai

A helyszíni adatátjáró két munkafolyamatot végez. Mielőtt rátérnénk az átjáró méretezésére és a javaslatokra, fontos tisztában lenni ezekkel a folyamatokkal.

Gyorsítótárazott adatok kezelése

A gyorsítótárazott adatokhoz kapcsolódó munkafolyamat olvassa be és alakítja át a Power BI-adathalmazokba betöltendő forrásadatokat. Ezt három lépésben végzi el:

  1. Kapcsolódás: Az átjáró kapcsolódik a forrásadatokhoz
  2. Adatbeolvasás és átalakítás: A lekért adatok szükség esetén át lesznek alakítva. Amikor csak lehetséges, a Power Query adategyesítési motor leküldi az átalakítási lépéseket az adatforrásba – ez az úgynevezett lekérdezésdelegálás . Ha ez nem lehetséges, akkor az átalakításokat az átjárónak kell elvégeznie. Ebben az esetben az átjáró több CPU- és memória-erőforrást használ.
  3. Átvitel: A rendszer átviszi az adatokat a Power BI szolgáltatásba – fontos a megbízható és gyors internetkapcsolat, főleg nagy adatmennyiségek esetén

A Gyorsítótárazott adatoknak a helyszíni forrásokhoz csatlakozó helyszíni adatátjárót ábrázoló diagramja.

Élő kapcsolatú és DirectQuery-munkafolyamatok

Az élő kapcsolatot és DirectQuery-t használó munkafolyamat többnyire átmenő módban működik. A Power BI szolgáltatás lekérdezéseket küld, az átjáró pedig a lekérdezési eredményekkel válaszol. A lekérdezési eredmények mérete általában kicsi.

Ez a folyamat a lekérdezések és a lekérdezési eredmények forgalmának irányításához igényel CPU-erőforrásokat. A CPU-igénye általában kisebb, mint a gyorsítótárazott adatokat kezelő munkafolyamaté – különösen akkor, ha gyorsítótárazandó adatok átalakításához van rá szükség.

A megbízható, gyors és konzisztens kapcsolat elengedhetetlen annak biztosításához, hogy a felhasználói felület gyorsan reagáljon.

Az Élő kapcsolat és a DirectQuery a helyszíni forrásokhoz csatlakozó helyszíni adatátjárót ábrázoló diagramja.

Méretezési szempontok

Az átjáró-számítógép megfelelő méretének meghatározása az alábbi változóktól függhet:

  • Gyorsítótáras munkafolyamatokhoz:
    • Az egyidejű adathalmaz-frissítések száma
    • Az adatforrások típusai (relációs adatbázis, analitikai adatbázis, adatcsatornák vagy fájlok)
    • Az adatforrásokból lekérendő adatok mennyisége
    • A Power Query adategyesítési motor által végrehajtandó átalakítások
    • A Power BI szolgáltatásnak továbbítandó adatok mennyisége
  • Élő kapcsolatú és DirectQuery-munkafolyamatokhoz:
    • A jelentést egyidejűleg használó felhasználók száma
    • A jelentésoldalakon lévő vizualizációk száma (minden vizualizáció legalább egy lekérdezést küld)
    • A Power BI-irányítópult lekérdezési gyorsítótárának frissítési gyakorisága
    • Az Automatikus oldalfrissítés funkciót használó valós idejű jelentések száma
    • Alkalmaznak-e az adathalmazok sorszintű biztonságot (RLS)

Az élő kapcsolatú és DirectQuery-munkafolyamatokhoz általában elegendő CPU-ra van szükség, a gyorsítótárazott adatokat kezelő munkafolyamatok viszont több CPU-t és memóriát igényelnek. Mindkét munkafolyamathoz jó minőségű kapcsolat szükséges a Power BI szolgáltatás és az adatforrások felé.

Megjegyzés

A Power BI-kapacitások korlátozzák a párhuzamosan végrehajtható modellfrissítéseket, valamint az élő kapcsolatok és a DirectQuery átviteli sebességét. Nincs értelme nagyobb teljesítményre méretezni az átjárót, mint amekkorát a Power BI szolgáltatás támogat. A különböző prémium szintű SKU-k (és méretben azokkal egyenértékű A SKU-k) korlátai eltérőek. További információ: A Power BI Premium bemutatása (Kapacitás-csomópontok).

Javaslatok

Az átjáró méretezésére vonatkozó javaslatok sok változó függvényei. Ebben a szakaszban megfontolásra érdemes, általános javaslatokat teszünk.

Kezdeti méretezés

A megfelelő méretet olykor nehéz pontosan megbecsülni. Javasoljuk, hogy induljon ki egy legalább 8 CPU-maggal, 8 GB memóriával és gigabites hálózati adapterekkel rendelkező gépből. Ezzel már mérni tudja az átjáró jellemző terhelését a CPU- és a memóriarendszer számlálóinak naplózásával. További információ: Helyszíni adatátjáró teljesítményének figyelése és optimalizálása.

Kapcsolatok

Tervezzen a lehető legjobb kapcsolattal a Power BI szolgáltatás és az átjáró, valamint az átjáró és az adatforrások között.

  • Törekedjen a megbízhatóságra, a gyorsaságra és a következetesen alacsony késésre
  • Iktassa ki – vagy csökkentse – az átjáró és az adatforrás közötti ugrásokat
  • Szüntesse meg a tűzfal-proxy réteg által megvalósított sávszélesség-szabályozást. A Power BI-végpontokról további információért lásd a Power BI URL-címek az engedélyezési listához való hozzáadásáról szóló részt.
  • Az Azure ExpressRoute konfigurálásával alakítson ki privát, felügyelt kapcsolatokat a Power BI-jal
  • Azure-beli virtuális gépeken lévő adatforrások esetén gondoskodjon arról, hogy a virtuális gépek a Power BI szolgáltatással közösen legyenek elhelyezve
  • A dinamikus sorszintű biztonságot érvényesítő SQL Server Analysis Services (SSAS) forrással élő kapcsolatban dolgozó munkafolyamatok számára biztosítson jó minőségű kapcsolatot az átjáró-számítógép és a helyszíni Active Directory között

Fürtözés

Nagy léptékű üzemelő példányok esetén több fürttaggal rendelkező átjárót is létrehozhat. A fürtök kiiktatják a rendszerkritikus meghibásodási pontokat, és terheléselosztást végezhetnek az átjárókon áthaladó forgalommal. A következőket teheti:

  • Telepítsen egy vagy több átjárót egy fürtben
  • A munkafolyamatokat különítse el önálló átjárókra, vagy átjárókiszolgáló-fürtökre

További információ: Magas rendelkezésre állású helyszíni adatátjáró-fürtök és terheléselosztás kezelése.

Adathalmaz-tervezés és -beállítások

Az adathalmazok kialakítása és beállításai befolyásolhatják az átjárók terhelését. Az átjáró terhelésének csökkentése érdekében az alábbi teendőket érdemes mérlegelni.

Importálás módú adathalmazokhoz:

  • Konfiguráljon kevésbé gyakori adatfrissítést
  • Konfiguráljon növekményes frissítést, ezzel minimalizálva az átvitt adatok mennyiségét
  • Amikor csak lehetséges, törekedjen a lekérdezések delegálására
  • Főleg nagy adatmennyiségek esetén, vagy ha kis késésű eredményekre van szükség, alakítsa át a tervet DirectQuery- vagy Összetett modellre

DirectQuery-adathalmazokhoz:

  • Optimalizálja az adatforrások, a modell és a jelentések terveit – erről az Útmutató a Power BI Desktop DirectQuery-modelljeihez című cikkben talál további információt
  • Hozzon létre összesítéseket, hogy a magasabb szintű eredmények gyorsítótárazásával csökkentse a DirectQuery-kérelmek számát
  • Korlátozza az automatikus oldalfrissítés gyakoriságát a jelentések kivitelezésében és a kapacitásbeállításokban
  • Korlátozza az irányítópult-gyorsítótár frissítési gyakoriságát, főleg akkor, ha dinamikus sorszintű biztonság van érvényben
  • Elsősorban a kisebb adatmennyiségek vagy nem gyakran változó adatok esetében konvertálja a tervet Importálás vagy Összetett módú modellre

Élő kapcsolatú adathalmazokhoz:

  • Korlátozza az irányítópult-gyorsítótár frissítési gyakoriságát, főleg akkor, ha dinamikus sorszintű biztonság van érvényben

Következő lépések

Ezzel a cikkel kapcsolatosan a következő forrásanyagokban talál további információt: