Jaa


Siirron suunnittelu: Azure Synapse Analytics, joka on omistettu SQL-varannot Fabric Data Warehouselle

Koskee:✅ Microsoft Fabric -varasto

Tässä artikkelissa käsitellään tietovarastoinnin strategiaa, huomioon otettavia seikkoja ja menetelmiä Azure Synapse Analyticsissa erillisissä SQL-varannoissa Microsoft Fabric Warehouseen.

Vihje

Azure Synapse Analyticsista erillisistä SQL-varannoista siirtymiseen on tarjolla automatisoitu käyttökokemus käyttämällä Fabric Migration Assistant for Data Warehouse -. Tämä artikkeli sisältää tärkeitä strategia- ja suunnittelutietoja.

Siirron johdanto

Kun Microsoft esitteli Microsoft Fabricin, joka on kattava SaaS-analytiikkaratkaisu yrityksille, joka tarjoaa kattavan palvelupaketin, kuten Data Factory, Data Engineering, Data Warehousing, Data Science, Real-Time Intelligence ja Power BI.

Tässä artikkelissa keskitytään rakenteen (DDL) siirtämiseen, tietokantakoodin (DML) siirtoon ja tietojen siirtoon. Microsoft tarjoaa useita vaihtoehtoja. Tässä yhteydessä keskustellaan jokaisesta vaihtoehdosta yksityiskohtaisesti ja annetaan ohjeita siihen, mitä näistä vaihtoehdoista sinun tulee pohtia skenaariossasi. Tässä artikkelissa käytetään TPC-DS-alan vertailuarvoa havainnollistamiseen ja suorituskykytestaukseen. Todellinen tulos voi vaihdella useiden tekijöiden mukaan, kuten tietotyypin, tietotyyppien, taulukoiden leveyden, tietolähteen viiveen jne.

Siirron valmisteleminen

Suunnittele siirtoprojektisi huolellisesti ennen aloittamista ja varmista, että rakenne, koodi ja tiedot ovat yhteensopivia Fabric Warehousen kanssa. Sinun on otettava huomioon joitakin rajoituksia . Kvantifioi yhteensopimattomien kohteiden uudelleenmuodostamistyö sekä muut resurssit, joita tarvitaan ennen siirtoa.

Toinen suunnittelun tärkeä tavoite on suunnittelun säätäminen, jotta voit varmistaa, että ratkaisusi hyödyntää täysimääräisesti Fabric Warehousen tarjoamaa suurta kyselysuoritustehoa. Tietovarastojen suunnitteleminen skaalausta varten tuo käyttöön ainutlaatuisia suunnittelumalleja, joten perinteiset lähestymistavat eivät aina ole parhaita. Tarkista suorituskyvyn ohjeet, koska vaikka joitakin rakenteen muutoksia voidaan tehdä siirron jälkeen, muutosten tekeminen prosessin aiemmaksi säästää aikaa ja vaivaa. Siirtyminen teknologiasta tai ympäristöstä toiseen on aina merkittävä ponnistus.

Seuraavassa kaaviossa esitetään siirron elinkaari, jossa luetellaan tärkeimmät pilarit, jotka koostuvat Arvioi ja arvioi, Suunnittele ja Suunnittele, Siirrä, Valvo ja Hallinnoi, Optimoi ja nykyaikaista pilarit, joihin liittyvät tehtävät kussakin pilarissa suunnitellaan ja valmistaudutaan sujuvaan siirtoon.

Siirron elinkaaren kaavio.

Runbook siirtoa varten

Harkitse seuraavia toimia suunnitteluoppaana siirtymiselle Synapse-erillisistä SQL-varannoista Fabric Warehouseen.

  1. Arvioi ja arvioi
    1. Tunnista tavoitteet ja motivaatiot. Luo selkeät halutut tulokset.
    2. Olemassa olevan arkkitehtuurin etsiminen, arvioiminen ja perustasoon määrittäminen.
    3. Tunnista tärkeimmät sidosryhmät ja sponsorit.
    4. Määritä siirrettävän kohteen laajuus.
      1. Aloita pienillä ja yksinkertaisilla laitteilla, valmistaudu useisiin pieniin siirtoihin.
      2. Aloita prosessin kaikkien vaiheiden seuraaminen ja dokumentointi.
      3. Luo tietojen ja prosessien luettelo siirtoa varten.
      4. Määritä tietomallin muutokset (jos sellaisia on).
      5. Määritä Fabric-työtila.
    5. Mikä on taitosi/mieltymyksesi?
      1. Automatisoi aina, kun se on mahdollista.
      2. Azuren sisäänrakennettujen työkalujen ja ominaisuuksien avulla voit vähentää siirtotoimia.
    6. Kouluta henkilökuntaa varhain uudella alustalla.
      1. Tunnistat tarpeiden ja koulutusresurssien osaamisen, kuten Microsoft Learnin.
  2. Suunnittele ja suunnittele
    1. Määritä haluttu arkkitehtuuri.
    2. Valitse siirtomenetelmä tai työkalut seuraavien tehtävien suorittamiseksi:
      1. Tietojen poiminta lähteestä.
      2. Schema (DDL) -muunto, mukaan lukien taulukoiden ja näkymien metatiedot
      3. Tietojen käsittely, mukaan lukien historialliset tiedot.
        1. Uudista tarvittaessa tietomalli uuden käyttöympäristön suorituskyvyn ja skaalattavuuden avulla.
      4. Tietokantakoodin (DML) siirto.
        1. Siirrä tai muodosta uudelleen tallennetut toimintosarjat ja liiketoimintaprosessit.
    3. Luetteloi ja poimi suojausominaisuudet ja objektien käyttöoikeudet lähteestä.
    4. Suunnittele ja suunnittele, miten voit korvata tai muokata olemassa olevia ETL/ELT-prosesseja lisäävän kuormituksen osalta.
      1. Luo rinnakkaisia ETL/ELT-prosesseja uuteen ympäristöön.
    5. Valmistele yksityiskohtainen siirtosuunnitelma.
      1. Yhdistä nykyinen tila uuteen haluttuun tilaan.
  3. Muuttaa
    1. Suorita rakenne, tiedot ja koodin siirto.
      1. Tietojen poiminta lähteestä.
      2. Schema (DDL) -muunto
      3. Tietojen käsittely
      4. Tietokantakoodin (DML) siirto.
    2. Skaalaa tarvittaessa varatut SQL-varannon resurssit tilapäisesti ylöspäin siirtämisen nopeuttamiseksi.
    3. Käytä suojausta ja käyttöoikeuksia.
    4. Siirrä olemassa olevat ETL/ELT-prosessit lisäävää kuormitusta varten.
      1. Siirrä tai muodosta uudelleen ETL/ELT lisäävä kuormitusprosessit.
      2. Kokeile ja vertaa rinnakkaisia lisäävän kuormituksen prosesseja.
    5. Mukauta yksityiskohtaista siirtosuunnitelmaa tarpeen mukaan.
  4. Valvonta ja hallinnoiminen
    1. Suorita rinnakkain ja vertaa lähdeympäristöäsi.
      1. Testaa sovelluksia, liiketoimintatietoympäristöjä ja kyselytyökaluja.
      2. Benchmark ja optimoi kyselyn suorituskyky.
      3. Valvo ja hallitse kustannuksia, suojausta ja suorituskykyä.
    2. Hallinnon vertailukohta ja arviointi.
  5. Optimoi ja modernisoi
    1. Kun liiketoiminta on mukavaa, siirtymäsovellukset ja ensisijaiset raportointiympäristöt on tarkoitus siirtää Fabriciin.
      1. Skaalaa resursseja ylös tai alas, kun kuormitus siirtyy Azure Synapse Analyticsista Microsoft Fabriciin.
      2. Luo toistettavissa oleva malli tuleville siirtymisille saatujen kokemusten pohjalta. Toistaa.
      3. Tunnista kustannusten optimoinnin, suojauksen, skaalattavuuden ja toiminnallisen huippuosaamisen mahdollisuudet
      4. Tunnista mahdollisuudet nykyaikaistaa tietotilaasi uusimmilla Fabric-ominaisuuksilla.

"Hissi ja vaihto" vai nykyaikaistaminen?

Yleisesti ottaen on olemassa kahdenlaisia siirtymisskenaarioita riippumatta suunnitellun siirron tarkoituksesta ja laajuudesta: lift and shift sellaisenaan tai vaiheittainen lähestymistapa, joka sisältää arkkitehtuuri- ja koodimuutokset.

Lift and shift

Hississä ja siirtymässä olemassa oleva tietomalli siirretään pienellä muutoksella uuteen Fabric Warehouseen. Tämä lähestymistapa minimoi riski- ja siirtoajan vähentämällä uutta työtä, jota tarvitaan siirron etujen toteuttamiseksi.

Hissien ja vaihdon siirtyminen sopii hyvin näihin tilanteisiin:

  • Käytössäsi on aiemmin luotu ympäristö, jossa on vain pieni määrä tietovaraston osavaraston osamalleja siirrettäväksi.
  • Sinulla on aiemmin luotu ympäristö, jossa tiedot ovat jo hyvin suunnitellussa tähti- tai Snowflake-rakenteessa.
  • Fabric Warehouseen siirtyminen aiheuttaa sinulle aikaa ja kustannuspaineita.

Yhteenvetona tämä lähestymistapa toimii hyvin niissä kuormituksissa, jotka on optimoitu nykyisessä Synapse-erillisessä SQL-varannot-ympäristössäsi, joten se ei vaadi suuria muutoksia Fabricissa.

Modernisoi vaiheittain arkkitehtonisilla muutoksilla

Jos vanha tietovarasto on kehittynyt pitkän ajan kuluessa, sinun on ehkä suunniteltava se uudelleen, jotta se säilyttää vaaditut suorituskykytasot.

Haluat ehkä myös suunnitella arkkitehtuurin uudelleen hyödyntääksesi Fabric-työtilassa saatavilla olevia uusia moduulia ja ominaisuuksia.

Suunnitteluerot: Synapse erilliset SQL-varannot ja Fabric Warehouse

Ota huomioon seuraavat Azure Synapse ja Microsoft Fabric -tietojen varastointierot vertaamalla erillisiä SQL-varantoja Fabric Warehouseen.

Huomioitavaa taulukoissa

Kun siirrät taulukoita eri ympäristöjen välillä, yleensä vain raakatiedot ja metatiedot siirtyvät fyysisesti. Muita lähdejärjestelmän tietokantaelementtejä, kuten indeksejä, ei yleensä siirretä, koska ne saattavat olla tarpeettomia tai toteutettu eri tavalla uudessa ympäristössä.

Lähdeympäristön suorituskyvyn optimoinnit, kuten indeksit, osoittavat, mihin voit lisätä suorituskyvyn optimoinnin uudessa ympäristössä, mutta nyt Fabric huolehtii siitä automaattisesti puolestasi.

Huomioitavaa T-SQL:ssä

On useita tietojenkäsittelykielen (DML) syntaksieroja, jotka on syytä tiedostaa. Katso T-SQL Surface -alue Fabric Data Warehousessa. Ota huomioon myös koodin arviointi, kun valitset tietokantakoodille (DML) siirtotapoja.

Siirron aikana vallinneiden pariteetin erojen mukaan sinun on ehkä kirjoitettava T-SQL DML -koodin osat uudelleen.

Tietotyyppien yhdistämismääritysten erot

Fabric Warehousessa on useita tietotyyppieroja. Lisätietoja on artikkelissa Microsoft Fabric -tietotyypit.

Seuraavassa taulukossa on tuettujen tietotyyppien yhdistäminen Synapse-erillisistä SQL-varannoista Fabric Warehouseen.

Synapse erilliset SQL-varannot Fabric Warehouse
money decimal(19,4)
smallmoney decimal(10,4)
smalldatetime datetime2
datetime datetime2
nchar char
nvarchar varchar
tinyint smallint
binary varbinary
datetimeoffset* datetime2

* Datetime2 ei tallenna siihen tallennettuja ylimääräisiä aikavyöhykkeen siirtymätietoja. Koska datetimeoffset-tietotyyppiä ei tällä hetkellä tueta Fabric Warehousessa, aikavyöhykkeen siirtymätiedot pitää poimia erilliseen sarakkeeseen.

Vihje

Valmis siirrettäväksi?

Jos haluat aloittaa automatisoidun siirtokokemuksen, lue artikkeli Fabric Migration Assistant for Data Warehouse.

Lisätietoja manuaalisista siirtovaiheista ja yksityiskohdista on artikkelissa Azure Synapse Analyticsille varatut SQL-varannot Fabric Data Warehouse -.