Adatok áthelyezése az Azure-ba és az Azure-ból
Az azure-ba és az azure-ból történő adatátadásnak számos lehetősége van az igényeitől függően.
Fizikai átvitel
Ha fizikai hardvert használ az adatok Azure-ba való átviteléhez, az a következő esetekben jó választás:
- A hálózat lassú vagy megbízhatatlan.
- A nagyobb hálózati sávszélesség költséges.
- A biztonsági vagy szervezeti szabályzatok nem engedélyezik a kimenő kapcsolatokat bizalmas adatok kezelésekor.
Ha az elsődleges szempont az adatok átvitelének időtartama, érdemes lehet egy tesztet futtatni annak ellenőrzésére, hogy a hálózati átvitel lassabb-e, mint a fizikai átvitel.
Az adatok Azure-ba való fizikai átvitelének két fő lehetősége van:
Az Azure Import/Export szolgáltatás
Az Azure Import/Export szolgáltatás lehetővé teszi nagy mennyiségű adat biztonságos átvitelét az Azure Blob Storage-ba vagy az Azure Filesba belső SATA-merevlemez-meghajtók (HDD-k) vagy SDD-k azure-adatközpontba történő szállításával. Ezzel a szolgáltatással adatokat is továbbíthat az Azure Storage-ból a merevlemez-meghajtókra, és a meghajtókat a helyszíni betöltéshez kézbesítheti Önnek.
Azure Data Box
Az Azure Data Box egy Microsoft által biztosított berendezés, amely az Import/Export szolgáltatáshoz hasonlóan működik. A Data Box segítségével a Microsoft egy védett, biztonságos és illetéktelen beavatkozásnak ellenálló átviteli berendezést szállít Önnek, és kezeli a végpontok közötti logisztikát, amelyet a portálon keresztül nyomon követhet. A Data Box szolgáltatás egyik előnye a könnyű használat. Nem kell több merevlemezt vásárolnia, előkészítenie és mindegyikbe átvinnie a fájlokat. A Data Boxot számos iparági vezető Azure-partner támogatja, hogy egyszerűbb legyen zökkenőmentesen használni az offline átvitelt a felhőbe a termékeikből.
Parancssori eszközök és API-k
Vegye figyelembe ezeket a beállításokat, ha szkriptes és programozott adatátvitelt szeretne:
Az Azure CLI egy platformfüggetlen eszköz, amely lehetővé teszi az Azure-szolgáltatások kezelését és az adatok storage-ba való feltöltését.
AzCopy. Windows vagy Linux rendszerű parancssorból származó AzCopy használatával egyszerűen másolhat adatokat a Blob Storage-ba, az Azure File Storage-ba és az Azure Table Storage-ba optimális teljesítménnyel. Az AzCopy támogatja az egyidejűséget és a párhuzamosságot, valamint lehetővé teszi a másolási műveletek folytatását egy esetleges megszakítás esetén. Az AzCopy használatával adatokat is másolhat az AWS-ből az Azure-ba. A programozott hozzáféréshez a Microsoft Azure Storage adatáthelyezési kódtár az AzCopyt működtető alapvető keretrendszer. .NET Core-kódtárként van megadva.
A PowerShell használatával a Start-AzureStorageBlobCopy PowerShell-parancsmag a PowerShellhez használt Windows-rendszergazdák számára is használható.
Az AdlCopy lehetővé teszi, hogy adatokat másoljon a Blob Storage-ból az Azure Data Lake Storage-ba. Két Data Lake Storage-fiók közötti adatmásolásra is használható. Azonban nem használható adatok másolására a Data Lake Storage-ból a Blob Storage-ba.
A Distcp használatával adatokat másolhat egy HDInsight-fürttárolóba (WASB) egy Data Lake Storage-fiókba.
A Sqoop egy Apache-projekt, amely a Hadoop-ökoszisztéma része. Minden HDInsight-fürtön előre telepítve van. Lehetővé teszi a HDInsight-fürt és a relációs adatbázisok, például az SQL, az Oracle, a MySQL stb. közötti adatátvitelt. A Sqoop a kapcsolódó eszközök gyűjteménye, beleértve az importálási és exportálási eszközöket. A Sqoop a HDInsight-fürtökkel a Blob Storage vagy a Data Lake Storage csatlakoztatott tároló használatával működik.
A PolyBase egy olyan technológia, amely a T-SQL-nyelven keresztül fér hozzá az adatbázison kívüli adatokhoz. Az SQL Server 2016-ban lekérdezéseket futtathat külső adatokon a Hadoopban, vagy adatokat importálhat vagy exportálhat a Blob Storage-ból. Az Azure Synapse Analyticsben adatokat importálhat vagy exportálhat a Blob Storage-ból és a Data Lake Storage-ból. Jelenleg a PolyBase a leggyorsabb módszer az adatok Azure Synapse Analyticsbe való importálására.
A Hadoop parancssort akkor használja, ha HDInsight-fürtfejcsomóponton található adatokkal rendelkezik. A parancs használatával ezeket az
hadoop -copyFromLocal
adatokat átmásolhatja a fürt csatolt tárhelyére, például a Blob Storage-ba vagy a Data Lake Storage-ba. A Hadoop parancs használatához először csatlakoznia kell a fő csomóponthoz. Miután csatlakozott, feltölthet egy fájlt a tárolóba.
Grafikus felület
Vegye figyelembe a következő beállításokat, ha csak néhány fájlt vagy adatobjektumot továbbít, és nem kell automatizálnia a folyamatot.
Az Azure Storage Explorer egy platformfüggetlen eszköz, amely lehetővé teszi az Azure Storage-fiókok tartalmának kezelését. Segítségével feltöltheti, letöltheti és kezelheti a blobokat, fájlokat, üzenetsorokat, táblákat, valamint az Azure Cosmos DB-entitásokat. A Blob Storage használatával kezelheti a blobokat és mappákat, valamint feltöltheti és letöltheti a blobokat a helyi fájlrendszer és a Blob Storage, illetve a tárfiókok között.
Azure Portal. A Blob Storage és a Data Lake Storage egyaránt webes felületet biztosít a fájlok feltárására és új fájlok feltöltésére. Ez a lehetőség akkor jó, ha nem szeretne eszközöket telepíteni vagy parancsokat kiadni a fájlok gyors felderítéséhez, vagy ha néhány újat szeretne feltölteni.
Adatszinkronizálás és folyamatok
Az Azure Data Factory egy felügyelt szolgáltatás, amely alkalmas a fájlok rendszeres átvitelére számos Azure-szolgáltatás, helyszíni rendszer vagy a kettő kombinációja között. A Data Factory használatával létrehozhat és ütemezhet adatvezérelt munkafolyamatokat, úgynevezett folyamatokat, amelyek különböző adattárakból származó adatokat használnak be. A Data Factory olyan számítási szolgáltatások használatával tudja feldolgozni és átalakítani az adatokat, mint az Azure HDInsight Hadoop, a Spark, az Azure Data Lake Analytics és az Azure Machine Learning. Adatvezérelt munkafolyamatokat hozhat létre az adatáthelyezés és adatátalakítás vezénylése és automatizálása érdekében.
A Data Factoryben és az Azure Synapse Analyticsben futó folyamatok és tevékenységek a végpontok közötti adatvezérelt munkafolyamatok létrehozására használhatók az adatáthelyezési és adatfeldolgozási forgatókönyvekhez. Emellett az Azure Data Factory integrációs modulja különböző hálózati környezetekben biztosít adatintegrációs képességeket.
Az Azure Data Box Gateway adatokat továbbít az Azure-ba és onnan, de ez egy virtuális berendezés, nem pedig merevlemez. A helyszíni hálózatban található virtuális gépek adatokat írnak a Data Box Gatewaybe a hálózati fájlrendszer (NFS) és az SMB protokollok használatával. Az eszköz ezután átviszi az adatokat az Azure-ba.
Kulcsválasztási feltételek
Adatátviteli forgatókönyvek esetén válassza ki az igényeinek megfelelő rendszert az alábbi kérdések megválaszolásával:
Nagy mennyiségű adatot kell továbbítania, ahol az internetkapcsolaton keresztüli műveletek túl sokáig tartana, megbízhatatlanok vagy túl drágák lennének? Ha igen, fontolja meg a fizikai átvitelt.
Inkább szkripteli az adatátviteli feladatokat, hogy újra felhasználhatók legyenek? Ha igen, válassza ki a parancssori beállítások vagy a Data Factory egyikét.
Nagy mennyiségű adatot kell továbbítania egy hálózati kapcsolaton keresztül? Ha igen, válasszon egy big data-ra optimalizált lehetőséget.
Át kell vinnie az adatokat egy relációs adatbázisba vagy onnan? Ha igen, válasszon egy vagy több relációs adatbázist támogató lehetőséget. Ezen lehetőségek némelyikéhez Hadoop-fürtre is szükség van.
Szüksége van automatizált adatfolyamra vagy munkafolyamat-vezénylésre? Ha igen, fontolja meg a Data Factoryt.
Képességmátrix
Az alábbi táblázatok összefoglalják a képességek főbb különbségeit.
Fizikai átvitel
Funkció | Az Importálás/exportálás szolgáltatás | Data Box |
---|---|---|
Űrlaptényező | Belső SATA HDD-k vagy SDD-k | Biztonságos, illetéktelen illetéktelen hozzáférésű, egy hardveres berendezés |
A Microsoft kezeli a szállítási logisztikát | Nem | Igen |
Integrálható a partnertermékekkel | Nem | Igen |
Egyéni berendezés | Nem | Igen |
Parancssori eszközök
Hadoop/HDInsight:
Funkció | DistCp | Sqoop | Hadoop parancssori felület |
---|---|---|---|
Big Data-adatokra optimalizálva | Igen | Igen | Igen |
Másolás relációs adatbázisba | Nem | Igen | Nem |
Másolás relációs adatbázisból | Nem | Igen | Nem |
Másolás a Blob Storage-ba | Igen | Igen | Igen |
Másolás a Blob Storage-ból | Igen | Igen | Nem |
Másolás a Data Lake Storage-ba | Igen | Igen | Igen |
Másolás a Data Lake Storage-ból | Igen | Igen | Nem |
Egyéb:
Funkció | Azure CLI | AzCopy | PowerShell | AdlCopy | PolyBase |
---|---|---|---|---|---|
Kompatibilis platformok | Linux, OS X, Windows | Linux, Windows | Windows | Linux, OS X, Windows | SQL Server, Azure Synapse Analytics |
Big Data-adatokra optimalizálva | Nem | Igen | Nem | Igen 1 | Igen 2 |
Másolás relációs adatbázisba | Nem | Nem | Nem | Nem | Igen |
Másolás relációs adatbázisból | Nem | Nem | Nem | Nem | Igen |
Másolás a Blob Storage-ba | Igen | Igen | Igen | Nem | Igen |
Másolás a Blob Storage-ból | Igen | Igen | Igen | Igen | Igen |
Másolás a Data Lake Storage-ba | Nem | Igen | Igen | Igen | Igen |
Másolás a Data Lake Storage-ból | Nem | Nem | Igen | Igen | Igen |
[1] Az AdlCopy big data átvitelére van optimalizálva, amikor egy Data Lake Analytics-fiókkal használják.
[2] A PolyBase teljesítménye növelhető a számítások Hadoopba való leküldésével és a PolyBase horizontális felskálázási csoportjainak használatával az SQL Server-példányok és a Hadoop-csomópontok közötti párhuzamos adatátvitel engedélyezéséhez.
Grafikus felületek, adatszinkronizálás és adatfolyamok
Funkció | Azure Storage Explorer | Azure Portal * | Data Factory | Data Box Gateway |
---|---|---|---|---|
Big Data-adatokra optimalizálva | Nem | Nem | Igen | Igen |
Másolás relációs adatbázisba | Nem | Nem | Igen | Nem |
Másolás relációs adatbázisból | Nem | Nem | Igen | Nem |
Másolás a Blob Storage-ba | Igen | Nem | Igen | Igen |
Másolás a Blob Storage-ból | Igen | Nem | Igen | Nem |
Másolás a Data Lake Storage-ba | Nem | Nem | Igen | Nem |
Másolás a Data Lake Storage-ból | Nem | Nem | Igen | Nem |
Feltöltés a Blob Storage-ba | Igen | Igen | Igen | Igen |
Feltöltés a Data Lake Storage-ba | Igen | Igen | Igen | Igen |
Adatátvitelek vezénylálása | Nem | Nem | Igen | Nem |
Egyéni adatátalakítások | Nem | Nem | Igen | Nem |
Díjszabási modell | Ingyenes | Ingyenes | Használatalapú fizetés | Fizetés egységenként |
Ebben az esetben az Azure Portal a Blob Storage és a Data Lake Storage webes felderítési eszközeit jelöli.
Közreműködők
Ezt a cikket a Microsoft tartja karban. Eredetileg a következő közreműködők írták.
Fő szerző:
- Zoiner Tejada | vezérigazgató és tervező
Következő lépések
- Mi az Az Azure Import/Export szolgáltatás?
- Mi az Az Azure Data Box?
- Mi az Az Azure CLI?
- Bevezetés az AzCopy használatába
- A Storage Explorer használatának első lépései
- Mi az Az Azure Data Factory?
- Mi az Az Azure Data Box Gateway?