Jaa


Mikä on Kopioi työ Data Factory for Microsoft Fabricissa?

Kopiointityö on Microsoft Fabric Data Factoryn go-to ratkaisu, joka yksinkertaistaa tietojen siirtämistä useista lähteistä useisiin kohteisiin – putkia ei tarvita. Kopiointityö tukee natiivisti useita toimitustyylejä, kuten joukkokopiointia, lisäävää kopiointia ja CDC (Change Data Capture) -replikointia, ja se tarjoaa joustavuutta käsitellä monenlaisia tiedonsiirtoskenaarioita – kaikki intuitiivisen ja helppokäyttöisen kokemuksen avulla. Olitpa uusi tietojen integroinnin käyttäjä tai haluat vain nopeamman tavan saada tiedot sinne, minne ne pitää siirtää, kopiointityö tarjoaa joustavan ja käyttäjäystävällisen ratkaisun.

Etuja

Kopioi työn etuja muihin tietojen siirtomenetelmiin verrattuna ovat muun muassa seuraavat:

  • Helppokäyttöinen: Määritä ja valvo tietojen kopiointia yksinkertaisella, ohjatulla kokemuksella – teknistä asiantuntemusta ei tarvita.
  • Tehokas: Kopioi vain uudet tai muuttuneet tiedot edellisestä ajosta säästääksesi aikaa ja resursseja minimaalisilla manuaalisilla vaiheilla.
  • Joustava: Valitse siirrettävät tiedot, yhdistä sarakkeet, määritä tietojen kirjoitustapa ja ajoita työt suoritettavaksi kerran tai säännöllisesti.
  • Korkea suorituskyky: Siirrä suuria tietomääriä nopeasti ja luotettavasti palvelimettoman, skaalautuvan järjestelmän ansiosta.

Näyttökuva, jossa näkyy Kopioi työ ja sen tulosruutu.

Voit myös käydä tietojen siirtostrategiassa nähdäksesi, miten kopiointityö vertautuu peilaus- ja kopiointitoimintaan putkissa.

Concepts

Kopiointitilat (täysi kopiointi, inkrementaalinen kopiointi)

Voit valita, miten tietosi kopioidaan lähteestä kohteeseen:

  • Täysi kopio: Aina kun työ suoritetaan, se kopioi kaikki tiedot lähteestä kohteeseen.
  • Lisäävä kopiointi: Ensimmäinen suoritus kopioi kaiken, ja seuraavat suoritukset siirtävät vain uusia tai muuttuneita tietoja edellisen suorituksen jälkeen.

Inkrementaalinen kopiointi (CDC, vesileima)

Inkrementaalisessa kopiossa jokainen ensimmäisen täyden kopion jälkeinen ajo siirtää vain muutokset:

  • Tietokannat: Vain uudet tai päivitetyt rivit kopioidaan. Jos Change Data Capture (CDC) on käytössä, lisätyt, päivitetyt ja poistetut rivit sisällytetään.
  • Tallennus: Vain tiedostot, joissa on uudempi LastModifiedTime, kopioidaan.

Kopiointityö seuraa ja hallitsee automaattisesti viimeisimmän onnistuneen suorituksen tilaa, jotta se tietää, mitä tietoja kopioidaan seuraavaksi.

  • Tietokannat: Sinun on valittava lisäävä sarake kullekin taulukolle. Tämä sarake toimii merkkinä, joka kertoo kopiointityölle, mitkä rivit ovat uusia tai päivitettyjä edellisen suorituksen jälkeen. Yleensä sarake on päivämäärä- ja aika-arvo tai kasvava luku. Jos tietokannassa on CDC käytössä, sinun ei tarvitse valita saraketta – Kopiointityö tunnistaa muutokset automaattisesti.
  • Tallennus: Kopiointityö vertaa lähdetallennustilassa olevien tiedostojen LastModifiedTime-arvoa edellisessä suorituksessa tallennettuihin arvoihin. Vain tiedostot, joissa on uudemmat aikaleimat, kopioidaan.

Katso lisätietoja Change Data Capture (CDC) -kohdasta Copy Job -kohdassa.

Kun kopiointityö epäonnistuu, sinun ei tarvitse huolehtia tietojen menetyksestä. Kopiointityö jatkuu aina edellisen onnistuneen suorituksen tilasta. Virhe ei muuta kopiointityön hallitsemaa tilaa.

Päivitysmenetelmät (liittäminen, korvaaminen, yhdistäminen)

Voit myös päättää, miten tiedot kirjoitetaan kohteeseen:

Oletusarvoisesti kopiointityö liittää uudet tiedot, joten säilytät täydellisen historian. Voit halutessasi yhdistää (päivittää aiemmin luodut rivit avainsarakkeella) tai korvata (korvata aiemmin luodut tiedot). Jos valitset Yhdistä, kopioi työ käyttää perusavainta oletusarvoisesti, jos sellainen on.

  • Tietokantaan kopioitaessa: uusia rivejä lisätään taulukoihin. Tuetuissa tietokannoissa voit myös yhdistää tai korvata olemassa olevat tiedot.
  • Tallennustilaan kopioitaessa: Uudet tiedot tallennetaan uusina tiedostoina. Jos samanniminen tiedosto on jo olemassa, se korvataan.

Kun teet lisäävän kopion lähteestä ja yhdistät kohteeseen, lähteen rivit lisätään tai päivitetään kohteeseen. Kun CDC-replikointi suoritetaan lähteestä ja yhdistetään kohteeseen, lähteen rivit lisätään, päivitetään tai poistetaan kohteeseen.

Palauta lisäävä kopio

Voit hallita lisäävää kopiota joustavasti, mukaan lukien mahdollisuus palauttaa se takaisin täyteen kopioon seuraavalla kerralla. Tämä on uskomattoman hyödyllistä, kun lähteen ja kohteen välillä on ristiriitaisia tietoja – voit yksinkertaisesti antaa kopiointityön suorittaa täyden kopion seuraavalla kerralla ongelman ratkaisemiseksi ja jatkaa sitten lisäpäivityksiä sen jälkeen.

Voit nollata inkrementaalisen kopioinnin joko koko työtä tai taulukkoa kohden, jolloin voit hallita sitä tarkasti. Voit esimerkiksi kopioida pienempiä taulukoita uudelleen vaikuttamatta suurempiin. Tämä tarkoittaa älykkäämpää vianmääritystä, vähemmän häiriöitä ja tehokkaampaa tiedonsiirtoa.

Joissakin tapauksissa, kun muokkaat kopiointityötä – esimerkiksi päivität lähdetaulukon lisäävää saraketta – kopiointityö palauttaa lisäävän kopion täydelliseksi kopioksi seuraavalla suorituksella. Tämä varmistaa tietojen yhdenmukaisuuden lähteen ja kohteen välillä.

Automaattinen taulukon luonti ja katkaisu kohteessa

Kopiointityö voi luoda taulukoita automaattisesti kohteeseen, jos niitä ei vielä ole. Jos kohdetaulukot ovat jo käytettävissä, voit valita ne kohteeksi. Joustavien sarakkeiden yhdistämismääritysasetusten avulla voit helposti määrittää, miten mallit yhdistetään lähdetaulukoista kohdetaulukoihin.

Automaattista taulukon luontia varten tuettuja yhdistimiä ovat muun muassa seuraavat:

  • Paikallinen SQL Server
  • Azure SQL -tietokanta
  • Hallittu Azure SQL -esiintymä
  • Synapse SQL -pooli
  • SQL-tietokanta Fabricissa
  • Fabric Lakehouse -taulukko
  • Snowflake

Voit myös halutessasi katkaista kohdetiedot ennen täyttä latausta ja varmistaa, että niiden lähde ja kohde synkronoidaan täysin ilman kaksoiskappaleita.

Oletusarvon mukaan Kopioi-työ ei poista mitään tietoja kohteesta. Kun otat tämän vaihtoehdon käyttöön:

  • Ensimmäinen lisäävän kopioinnin suoritus katkaisee kaikki kohteen tiedot ennen koko tietojoukon lataamista.
  • Myöhemmät lisäävät kopiot jatkavat tietojen liittämistä tai yhdistämistä vaikuttamatta aiemmin luotuihin tietueisiin.
  • Jos asiakkaat palauttavat myöhemmin lisäävän kopion täydelliseksi kopioksi, tämän vaihtoehdon ottaminen käyttöön tyhjentää kohteen uudelleen ennen lataamista.

Tämä lähestymistapa varmistaa, että kohde pysyy puhtaana, täysin synkronoituna ja ilman kaksoiskappaleita, mikä tarjoaa luotettavan perustan tietojen käsittelyratkaisulle.

Tuetut liittimet "Katkaise kohde ennen täyttä kopiointia" -vaihtoehdolle:

  • Paikallinen SQL Server
  • Azure SQL -tietokanta
  • Hallittu Azure SQL -esiintymä
  • Synapse SQL -pooli
  • SQL-tietokanta Fabricissa
  • Fabric Lakehouse -taulukko
  • Snowflake

Suoritusasetukset (Suorita, Aikataulu, Tapahtuman käynnistin)

Sinulla on täysi joustavuus päättää, milloin kopiointityö suoritetaan – se voidaan suorittaa kerran tai aikataulun mukaan. Vaikka työ olisi ajoitettu, voit silti käynnistää sen manuaalisesti valitsemalla Suorita milloin tahansa. Lisäävässä kopiossa manuaalisesti käynnistetty työ siirtää edelleen vain edellisen suorituksen jälkeiset muutokset.

Kun kopiointityössä tuetaan useita aikatauluja , saat entistä paremman hallinnan. Yhdellä kopiointityöllä voi olla useita aikatauluja, esimerkiksi yksi suoritetaan päivittäin klo 6 aamulla ja toinen viikoittain sunnuntaisin. Kaikkia aikatauluja voidaan hallita suoraan samassa kopiointityössä, mikä tekee orkestroinnista yksinkertaisempaa, selkeämpää ja tehokkaampaa.

Jos käytät kopiointityöaktiviteettia putkessa, voit myös hyödyntää putken orkestrointi- ja käynnistinominaisuuksia. Tapahtumakäynnistimien avulla voit esimerkiksi käynnistää kopiointityötehtävän, kun tapahtuu tiettyjä tapahtumia, kuten Data Lake -tallennustilaan saapuvia uusia tiedostoja tai muutoksia tietokantaan.

Katso lisätietoja kopiointityötehtävästä.

Isännöintivaihtoehdot (VNet, paikallinen, pilvi)

Kopiointityön avulla voit siirtää tietoja mistä tahansa lähteestä mihin tahansa kohteeseen riippumatta siitä, ovatko tietosi paikallisia, pilvipalvelussa vai näennäisverkossa. Kopioi työ -yhteyssivulla voit valita useista isäntävaihtoehdoista, mukaan lukien paikallinen yhdyskäytävä tai VNet-yhdyskäytävä, jotta voit käyttää tietoja turvallisesti palomuurin takana tai virtuaaliverkossa.

Katso lisätietoja tietojen siirron suojaamisesta kopiointityön ja Virtual Network Data Gatewayn avulla.

Operationalisointi (GIT/CICD, muuttujakirjasto)

Voit käyttää lähteenhallintaa, jatkuvaa integrointia, jatkuvaa käyttöönottoa ja yhteistyöympäristöä onnistuneiden data-analytiikkaprojektien suorittamiseen kopiointityön avulla.

Lisäksi muuttujakirjaston tuen avulla voit parametroida yhteyksiä kopiointityössä. Tämä tehokas ominaisuus virtaviivaistaa CI/CD:tä ulkoistamalla yhteysarvot, jolloin voit ottaa saman kopiointityön käyttöön useissa ympäristöissä, kun taas muuttujakirjasto lisää oikean yhteyden kuhunkin vaiheeseen.

Katso lisätietoja kopiointityön CI/CD-levyltä.

Havaittavuus

Katso lisätietoja kohdasta Kopiointityön valvonta.

Alueen saatavuus

Kopiointityön käytettävyys alueessa on sama kuin Fabricilla.

Pricing

Saat tiedot hinnoittelusta Kopioi työ.

Tuetut liittimet

Kopiointityön avulla voit siirtää tietoja pilvipalvelutietosäilöjen välillä tai paikallisista lähteistä, jotka ovat palomuurin takana tai näennäisverkon sisällä yhdyskäytävän avulla. Kopiointityö tukee seuraavia tietosäilöjä lähteinä tai kohteina:

Connector Source Destination Luku – koko lataus Lue - Lisäävä kuormitus (vesileimapohjainen) Lue - CDC (esikatselu) Kirjoita – Liitä Kirjoitus – ohitus Kirjoita - Upsert Kirjoita - CDC-yhdistäminen
Azure SQL -tietokanta
Oracle
Paikallinen SQL Server
Kankaan varasto
Fabric Lakehouse -taulukko
Fabric Lakehouse -tiedosto
Amazon S3
Azure Data Lake Storage Gen2
Azure Blob -säilö
Hallittu Azure SQL -esiintymä
Snowflake
Azure Synapse Analytics
Azure Data Explorer
Azure PostgreSQL
Google-pilvitallennus
MySQL
Azure MySQL
PostgreSQL
SQL-tietokanta Fabricissa (esikatselu)
Amazon S3 -yhteensopiva
SAP HANA
ODBC
Amazon RDS SQL Serverille
Google BigQuery
Salesforce
Salesforce-palvelun pilvipalvelu
Azure-taulukot
Azure Files
SFTP
FTP
IBM Db2 -tietokanta
Vertica
ServiceNow
Oracle Cloud Storage
MariaDB
Dataverse
Dynamics 365
Dynamics CRM
Azure Cosmos DB for NoSQL
HTTP
Azure Cosmos DB for MongoDB
MongoDB-atlas
Mongo DB
ODATA
SharePoint Online -luettelo
Dynamics AX
Azure-tekoälyhaku
Kansio
Vihreä luumu
REST
SAP-taulukko
SAP BW Open Hub
Kassandra
Informix
Amazon RDS Oraclelle
Microsoft Access
Presto

Lähetä palautetta kangasideoista ja liity keskusteluun kangasyhteisössä.