Megosztás a következőn keresztül:


Adatdeduplikáció – áttekintés

 

Közzétéve: 2016. augusztus

Hatókör: Windows Storage Server 2012, Windows Server 2012 R2, Windows Server 2012

Ez a témakör a Windows Server 2012 R2 és a Windows Server 2012 adatdeduplikációs szolgáltatását ismerteti, és részletesen bemutatja annak gyakorlati alkalmazását.

A szolgáltatás leírása

Az adatok deduplikálása megkeresi és eltávolítja az adatok ismétlődéseit az adatok megbízhatóságának és épségének veszélyeztetése nélkül. A célja, hogy több adatot tároljon kevesebb helyen a fájlok változó méretű kis adattömbökbe szegmentálásával (32–128 KB), az ismétlődő adattömbök azonosításával és az egyes adattömbök egyetlen másolatának megtartásával. Az adattömbök redundáns másolatait az egyetlen fennmaradó másolatra mutató hivatkozások váltják fel. Az adattömböket a program tömöríti, majd speciális tárolófájlokba rendezi a rendszerkötet információit tartalmazó mappában.

Az eredmény az egyes fájlok átalakulása a lemezen az 1. ábrán látható módon. A deduplikáció után a fájlokat nem önálló adatfolyamokként tárolja a rendszer, hanem csonkok váltják fel őket, amelyek egy közös adattömbtárban tárolt adatblokkokra mutatnak. Mivel a blokkokat közösen használják a fájlok, a rendszer csak egyszer tárolja őket, így kisebb lemezterületre van szükség az összes fájl tárolásához. A fájl elérése során a megfelelő blokkok átlátható módon rendeződnek, hogy az adatokat az alkalmazás hívása nélkül biztosítsák, illetve anélkül, hogy a felhasználó bármit is tudna a fájl átalakításáról a lemezen. Ez lehetővé teszi a rendszergazdák számára, hogy deduplikálják a fájlokat, és nem kell aggódniuk az alkalmazások viselkedésének változása vagy a fájlokhoz hozzáférő felhasználókat érintő hatás miatt.

1. ábra – Fájlok átalakítása lemezen

1. ábra   Fájlok lemezen történő átalakítása az adatdeduplikáció során

Egy kötet deduplikációjának engedélyezése és az adatok optimalizálása után a kötet a következőket tartalmazza:

  • Nem optimalizált fájlok. A nem optimalizált fájlok közé tartoznak például azok a fájlok, amelyek nem felelnek meg a fájlok korára vonatkozó kiválasztott házirend-beállításnak, a rendszerállapotfájlok, az alternatív adatfolyamok, a titkosított fájlok, a kiterjesztett attribútumokkal rendelkező fájlok, a 32 KB-nál kisebb fájlok, az egyéb újraelemzésipont-fájlok, illetve a más alkalmazások által éppen használt fájlok (a Windows Server 2012 R2 már nem tartalmazza a „használatban” korlátot).

  • Optimalizált fájlok. Azok az újraelemzési pontként tárolt fájlok, amelyek az adattömbtárban található megfelelő adattömbök térképére irányuló mutatókat tartalmaznak. Ezek a mutatók a fájl helyreállításához szükségesek, amikor erre vonatkozó kérés érkezik.

  • Adattömbtár. Az optimalizált fájladatok helye.

  • További szabad terület. Az optimalizált fájlok és az adattömbtár sokkal kevesebb helyet foglalnak, mint az optimalizálás előtt.

Gyakorlati alkalmazásmódok

A vállalat adattárolási növekedésének kezelése érdekében a rendszergazdák konszolidálják a kiszolgálókat, és legfőbb célként a kapacitás méretezését, illetve az adatok optimalizálását tűzik ki. Az Adatdeduplikáció praktikus módszereket biztosít ezen célok eléréséhez, többek a következőket:

  • A kapacitás optimalizálása. Az adatdeduplikációval több adat tárolható kisebb fizikai területen. Hatékonyabb tárolást biztosít, mint a korábban elérhető szolgáltatások, például az egypéldányos tárolás (Single Instance Storage, SIS) vagy az NTFS-tömörítés. Az adatdeduplikáció az alfájlokat változó méretű adattömbökbe rendezi és tömöríti, amivel 2:1 optimalizálási arányt tesz lehetővé az általános fájlkiszolgálók és akár 20:1 arányt a virtualizálási adatok számára.

  • Méretezés és teljesítmény. Az adatdeduplikáció nagymértékben méretezhető, erőforrás-takarékos, és nem zavarja a rendszer működését. A Windows Server 2012 R2 rendszerben akár 50 MB, a Windows Server 2012 rendszerben pedig körülbelül 20 MB adatot tud feldolgozni másodpercenként. Több köteten is futtatható anélkül, hogy befolyásolná a rendszer többi munkaterhelését. A kiszolgáló munkaterheléseire gyakorolt csekély hatást a processzor és memória-erőforrások használatának szabályozásával tartja fenn. Ha a kiszolgáló terhelése túlzottan megnő, a deduplikáció teljesen leállhat. A rendszergazdák emellett bármikor szabadon futtathatnak adatdeduplikációs feladatokat, ütemezhetik az adatdeduplikáció futtatásának idejét, valamint fájlkiválasztási házirendeket hozhatnak létre.

  • Megbízhatóság és adatintegritás. Az adatdeduplikáció alkalmazásakor az adatok sértetlenek maradnak. Az adatdeduplikáció ellenőrzőösszegekkel, konzisztencia- és identitás-ellenőrzéssel biztosítja az adatok sértetlenségét. Az adatdeduplikáció minden metaadat és a leggyakrabban hivatkozott adatok esetén fenntartja a redundanciát, így adatsérülés esetén is helyreállíthatók az adatok.

  • Sávszélesség-takarékosság a BranchCache segítségével. A BranchCache-integráció révén a program ugyanezeket az optimalizálási technikákat alkalmazza a WAN-kapcsolaton keresztül a fiókirodába továbbított adatokra. Ennek eredményeképp a fájlok letöltési ideje és a sávszélesség-használat is csökken.

  • Optimalizáláskezelés a jól ismert eszközökkel. Az adatdeduplikáció beépített optimalizálási funkcióval rendelkezik a Kiszolgálókezelőben és a Windows PowerShellben. Az alapértelmezett beállítások azonnali megtakarításokat biztosíthatnak, de a rendszergazdák további előnyökre is szert tehetnek a beállítások finomhangolásával. A Windows PowerShell-parancsmagok használatával könnyedén indíthat optimalizálási feladatokat vagy ütemezheti a későbbi futtatásukat. Az adatdeduplikációs szolgáltatás telepítése és a kiválasztott köteteken történő deduplikációjának engedélyezése egy Windows PowerShell-parancsfájlt meghívó unattend.xml fájl használatával is elérhető, és a Sysprep eszközzel együtt használható a deduplikáció üzembe helyezésére az első rendszerindításnál.

Új és módosított funkciók

A következő táblázat az adatdeduplikációs szolgáltatás változásait ismerteti. További információ: Az Adatdeduplikáció a Windows Server újdonságai.

Szolgáltatás/funkció

Új vagy továbbfejlesztett?

Leírás

Adatdeduplikáció a virtuális asztali infrastruktúra- (VDI-) munkaterhelések távoli tárolásához

A Windows Server 2012 R2 újdonsága

Ha adatdeduplikációt hajt végre a fürt megosztott kötetein, a virtuális asztali infrastruktúra- (VDI-) munkaterheléseihez optimalizálhatja az aktív virtuális merevlemezeket.

Optimalizált fájl kiterjesztése az eredeti elérési útján

A Windows Server 2012 R2 újdonsága

Az új Expand-DedupFile parancsmag Windows PowerShellben való használatával az eredeti elérési útra bonthatja ki az adott elérési úton található optimalizált fájlokat, ha ez szükséges az alkalmazásokkal való kompatibilitás, a teljesítmény vagy egyéb követelmények miatt. További információk a parancsmagról: T:Deduplication.Expand-DedupFile.

Adatdeduplikáció a virtualizált biztonsági mentési alkalmazások által használt biztonsági mentési köteteken

A Windows Server 2012 R2 újdonsága

Ha adatdeduplikációt hajt végre a fürt megosztott kötetein vagy korlátozott, többszörösen összevont konfigurációkon, optimalizálhatja a virtualizált biztonsági mentési alkalmazások munkaterhelései által használt aktív virtuális merevlemezeket. (A 2014 novemberében kiadott, (KB 3000850) jelű kumulatív frissítéssel rendelkező Windows Server 2012 R2 rendszeren és újabb verziókon támogatott.)

Követelmények

Az adatdeduplikáció előnyeinek kihasználásához a környezetnek az alábbi követelményeknek kell megfelelnie:

  • Kiszolgáló: Egy számítógép vagy virtuális gép, amelyen a Windows Server 2012 R2 vagy a Windows Server 2012 legalább egy adatkötettel fut

  • (Opcionális) Egy másik számítógép vagy virtuális gép, amelyen Windows Server 2012 R2 vagy Windows Server 2012 fut, és amely hálózaton keresztül kapcsolódik a kiszolgálóhoz

    Fontos

    Ha az adatdeduplikáció VDI-n vagy virtualizált biztonsági mentési munkaterhelésen történik, az összes VHD-fájlt:

    • egy Windows Server 2012 R2 rendszerű fájlkiszolgálónak kell tárolnia, és a tárolási csomópontnak, illetve a számítási csomópontnak különböző kiszolgálókon kell futnia.

    • egy helyi tárolóban kell tárolni egy adott, korlátozott, többszörösen összevont konfigurációban. A részletes követelményeket lásd: Az adatdeduplikáció üzembe helyezésének megtervezése.

Együttműködés az Azure virtuális gépekkel

Ezt a Windows Server szerepkör-szolgáltatást futtathatja Azure virtuális gépeken. Ez a forgatókönyvet Windows Server 2012 R2 rendszerrel tesztelték. Az adatdeduplikáció használata olyan Windows Azure virtuális gépekkel ajánlott, amelyeknek a kötetein az olvasási műveletek gyakoriak, de az írási műveletek ritkák. Ilyen körülmények között az adatdeduplikációval hatékonyan tárolhat több adatot az Azure virtuális gépeken.

Az alábbi munkaterhelések megfelelőek lehetnek az adatdeduplikációval való használathoz az Azure virtuális gépeken:

  • Általános fájlkiszolgálók viszonylag statikus tartalommal

  • Microsoft SharePoint-webhelyek viszonylag statikus tartalommal

  • Webhelyek viszonylag statikus tartalommal

Az alábbi munkaterhelések a munkaterhelések által használt nagy fájlok gyakori változásai miatt nem ajánlottak az adatdeduplikációval való használatra Azure virtuális gépeken:

  • Üzenetküldési kiszolgálók, például a Microsoft Exchange Server

  • Adatbázis-kiszolgálók, például a Microsoft SQL Server

Az Azure virtuális gépekkel kapcsolatos első lépések megismeréséhez látogasson el az Azure webhelyére.

Architektúra áttekintése

Az adatdeduplikációs szolgáltatás egy, a helyi vagy távoli I/O-műveleteket figyelő szűrőillesztőből és a három elérhető feladattípust szabályozó deduplikációs szolgáltatásból (optimalizálás, szemétgyűjtés és adattisztítás) épül fel.

A deduplikációs architektúra szerves része a hardveres hibák esetén tanúsított rugalmasság, valamint az adatok és metaadatok teljes ellenőrzőösszegének ellenőrzése, ideértve a metaadatok és a leggyakrabban elért adattömbök redundanciáját.

Az adatdeduplikáció a kiválasztott kötet minden adatát képes lehet feldolgozni (kivéve a 32 KB-nál kisebb fájlokat, a kihagyott mappákban szereplő fájlokat vagy a korbeállítással rendelkező fájlokat). A funkció engedélyezése előtt gondosan mérje fel, hogy a kiszolgáló és a kapcsolódó kötetek alkalmasak-e a deduplikációra. A deduplikáció során erősen ajánlott a biztonsági mentés készítése a fontos adatokról.

Lásd még:

További kapcsolódó információt az alábbi források kínálnak.

Tartalom típusa

Hivatkozások

Termékértékelés

Telepítés

Műveletek

Közösségi források

Kapcsolódó technológiák