Udfordringer i clouddatacentre

12 minutter

Med fremkomsten af cloudcomputing bliver det afgørende for datacenterdesignere at håndtere cloudmiljøets aktuelle og skiftende behov. I dette paradigme hoster datacentre fysisk alle de cloudtjenester, der leveres til brugerne. Cloudtjenesterne er til gengæld udtrukket fra de underliggende fysiske ressourcer på forskellige skalaer (via et privat IP-netværk som f.eks. en privat cloud eller over internettet som en offentlig cloud), efter behov og for potentielt millioner af abonnenter. Designkrav til datacentre varierer afhængigt af brug, størrelse og ønskede funktioner. Cloudmodellen omdefinerer den måde, datacenteraktiver designes og forbruges på. Cloudbaserede tjenester og skalering stiller nye krav til datacentre, hvor trafikflow varierer, I/O-båndbredden og ydeevnekravene øges betydeligt, og der opstår nye sikkerhedsproblemer. Vi beskriver nogle af de udfordringer, som cloudcomputing stiller til datacentre og identificerer tilknyttede krav til design af cloudcentrerede datacentre.

Skalerbarhed

Med cloudcomputing er der et stadigt stigende behov for udvidelse og høj kapacitet. Clouddatacentre er derfor typisk designet omkring virtuelle maskiner (eller instanser), som er databehandlingsenhederne i cloudparadigme. I modsætning til virksomhedsdatacentre tilbyder clouddatacentre tjenester til potentielt millioner af brugere. Virtualiseringsteknikker anvendes som regel for at imødekomme stigende brugerkrav til tjenester i cloudmiljøet. Med virtualisering kan datacenteroperatorer automatisk klargøre og deprovisionere virtuelle maskiner (VM'er) efter behov uden at tilføje eller omkonfigurere fysiske enheder. I dag er det ikke ualmindeligt at klargøre 20 eller flere VM'er pr. rackmonterings- eller bladeserver. Det er klart, at denne belastning i høj grad kan stresse serverens ressourcer (f.eks. CPU, RAM og netværkskort). Dette kan desuden øge antallet af logiske servere, der fungerer via det fysiske datacenternetværk, drastisk. Med et rack på 64 servere og 20 VM'er pr. server kræver en cloududbyder f.eks. op til 1.200 IP-undernet og VLAN'er. (I netværk kan et LAN segmenteres i forskellige udsendelsesdomæner, der hver især kaldes et VLAN). Desuden kræves der kun 10 racks, 12.000 IP-undernet og VLAN'er. Dette behov skaber et stort problem, fordi det overskrider grænsen (f.eks. 4.094) af brugbare VLAN'er, der er angivet af IEEE 802.1Q-standarden, endsige belaster fysiske parametre/routere. Clouddatacenterudbydere skal finde løsninger på sådanne problemer.

På den anden side, selv med maksimal brug af virtualiseringsteknikker, vil det på et tidspunkt være nødvendigt at tilføje fysisk kapacitet for at understøtte vækst. Clouddatacentre skal derfor være baseret på modulopbyggede design for at understøtte nem tilføjelse af fysisk kapacitet uden at forstyrre programmer og tjenester. Designere skal angive kabinetkapacitet for at understøtte langsigtet vækst, så datacenteroperatører kan inkludere yderligere komponenter til chassiset efter behov.

Netværk topologier

Traditionelt hierarkisk datacenternetværkstopologi i træstil.

Figur 20: Traditionelt hierarkisk datacenternetværkstopologi i træstil

De fleste datacenternetværk i dag er baseret på hierarkiske design i træstil, der består af tre hovedniveauer: et adgangsniveau, et sammenlægningsniveau og et kerneniveau. Figuren viser et eksempel på en traditionel netværkstopologi i træstil. For det første består adgangsniveauet af omkostningseffektive Ethernet-switche, der forbinder rackservere og IP-baserede lagerenheder (typisk 10/100-Mbps- eller 1 GbE-forbindelser). For det andet er flere adgangsparametre tilsluttet via Ethernet (typisk 1/10 GbE-forbindelser) til en enkelt sammenlægningskontakt. For det tredje er et sæt sammenlægningskontakter forbundet til et lag af kernekontakter. Da lag 2 VLAN'er ikke involverer IP-routing, implementeres de typisk på tværs af adgangs- og aggregeringsniveauer. Omvendt implementeres lag 3-routing ved kerneparametre, der videresender trafik mellem sammenlægningsparametre, til et intranet og til internettet. Et fremtrædende punkt er, at båndbredden mellem to servere er afhængig af deres relative placeringer i netværkstopologien. Noder, der er på samme rack, har f.eks. højere båndbredde mellem dem i modsætning til noder, der ikke er rack.

Netværket er en vigtig komponent i clouddatacentre. Hierarkiske topologier, som vist i figuren, passer ikke helt til cloudmiljøer, fordi de gennemtvinger trafik mellem servere for at gennemgå flere switchlag, der hver især føjer til ventetiden. Ventetid i denne kontekst refererer til de forsinkelser, der er opstået som følge af antallet af parametre, der gennemgås, påkrævet behandling og bufferlagring. Minimale forsinkelser i cloudmiljøer kan resultere i brugernes opfattelse af dårlig ydeevne og tab af produktivitet. Derfor er fladere netværks topologier med færre lag for at imødekomme forsinkelses- og volumentung trafik typisk påkrævet for clouddatacentre.

Større udnyttelse og robusthed

Normalt er moderne datacenternetværk i træstil afhængige af en variant af STP (Spanning Tree Protocol) for at opnå robusthed. STP er en protokol til administration af datalinks, der sikrer en løkkefri topologi, når kontakter/broer forbindes via flere stier. STP tillader kun én aktiv sti på tværs af to parametre, mens resten er angivet til inaktiv (forudsat at der er mange tilgængelige stier). På en aktiv stifejl vælger STP automatisk en anden tilgængelig inaktiv sti i stedet for den mislykkede sti. Dette valg kan tage STP flere sekunder, hvilket kan blive uegnet til forsinkelsesfølsomme cloudprogrammer (f.eks. webmøder). Desuden er indstilling af inaktive sikkerhedskopieringsstier ikke det bedste valg for clouddatacentre, især ikke med den eksponentielle stigning i brugerkrav. Clouddatacentre kræver mere strømlinede og robuste netværksdesign, der udnytter netværksressourcer fuldt ud og genopretter efter fejl i millisekunder for at imødekomme kravene hurtigt og udnytte ressourcerne effektivt.

Sikker multitenantmiljø

kommunikation mellem arbejdsbelastninger og arbejdsbelastninger i et virtualiseret miljø.

Figur 21: Kommunikation mellem arbejdsbelastninger i et virtualiseret miljø

I moderne datacentre udrulles arbejdsbelastninger (f.eks. databaser, brugerprogrammer, webhosting) typisk på særskilte fysiske servere, hvor kommunikation mellem arbejdsbelastninger sker via fysiske forbindelser. Derfor kan sikring af brugerne opnås ved konventionelle netværksbaserede systemer til registrering/forebyggelse af indtrængen. På den anden side kan der i clouddatacentre klargøres flere VM'er på en enkelt rackserver, hvor hver enkelt tilhører en anden bruger. Kommunikation mellem arbejdsbelastninger kan således foregå på den samme server via virtuelle forbindelser på en måde, der er helt gennemsigtig for eksisterende sikkerhedssystemer, som vist i figuren. Derfor skal clouddatacentre isolere brugere, beskytte virtuelle ressourcer og sikre kommunikation inden for serveren.

Virtuel maskinemobilitet

Clouddatacentre kan hoste bruger-VM'er på servere i ét rack, på tværs af racks, men i det samme datacenter eller på servere på tværs af datacentre. En cloud kan omfatte flere datacentre (f.eks. giver Amazon brugerne mulighed for at klargøre virtualiserede forekomster på tværs af mange datacentre). For at udføre rutinemæssig vedligeholdelse, afbalancere belastninger og tolerere fejl skal cloudmiljøer regelmæssigt og problemfrit overføre VM'er mellem fysiske servere uden at påvirke brugertjenester og -programmer. Denne migrering kræver ikke kun udvidelse af domænet lag 3 (det domæne, hvor IP-routing er påkrævet, f.eks. WAN) for at flytte VM'er på tværs af datacentre. Det kræver også, at domænet lag 2 udvides (det domæne, hvor der ikke er nogen routing, og hvor der kun bruges udsendelse, f.eks. LAN), for at kunne strække sig over flere datacentre.

Hurtig og meget tilgængelig lagertransport

Lagring i et clouddatacenter skal understøtte vm-mobilitet og være til stadighed tilgængelig. VM'er, der er migreret, skal vedligeholde kommunikationen med deres lagersystemer. En måde at omgå dette på er ved at flytte VM'er med vedrørende lager/data. Dette kræver naturligvis meget tilgængelig, lav ventetid og båndbreddekrævende forbindelse til clouddatacentre. Flere lagermodeller (f.eks. Storage over IP [SoIP], Fibre Channel over Ethernet [FCoE] og traditionel Fibre Channel) er i brug i dag og kræver desuden høj ydeevne og højt tilgængelige cloudnetværk.

Kort sagt kræver datacentre, der er skræddersyet til cloudmiljøer, følgende:

Modulopbyggede design, der understøtter eksponentiel vækst og nem tilføjelse af fysisk kapacitet uden afbrydelse af tjenesten.
Fladere netværks topologier med færre lag og mindre udstyr og kabler for at imødekomme forsinkelses- og volumentung trafik.
Mere effektive og robuste netværksdesign, der udnytter netværksressourcer fuldt ud og genopretter efter fejl i millisekunder.
Mulighed for fuldt ud at isolere cloudbrugere, beskytte virtuelle ressourcer og sikre kommunikation inden for serveren.
VM-mobilitet til at udføre rutinemæssig vedligeholdelse, opnå belastningsjustering og tolerere fejl problemfrit og hurtigt.
Servicetilgængelighed døgnet rundt, 365 dage om året og muligheden for at holde migrerende VM'er tilsluttet deres lagersystemer.

Krav til clouddatacentre

Datacenterdesignere kan håndtere de tidligere diskuterede krav på infrastrukturlaget, virtualiseringslaget eller begge dele. Skalerbarhedskravet skal f.eks. håndteres på begge lag, hvorimod sikker multitenancy hovedsageligt kan håndteres på virtualiseringslaget. Ressourcedeling og virtualisering beskrives detaljeret i et senere modul. I dette modul beskæftiger vi os med infrastrukturlaget. Derfor præsenterer vi kun nogle af de it-enheder (f.eks. switche, routere), platforme og protokoller, der kan bidrage til at opfylde kravene til clouddatacentre. Da dette er et cloudcomputingkursus, diskuterer vi ikke, hvordan enheder, protokoller og platforme fungerer, men fokuserer på de fordele, de giver for clouddatacentre.

For at starte med kan datacenterplanlæggere overveje multiprotocol-navneskift (MPLS) for at imødekomme krav til cloudinfrastrukturen. MPLS er en yderst skalerbar mekanisme, der dirigerer data fra én server til en anden baseret på navne på korte stier i stedet for lange netværksadresser. MPLS mærkater datapakker og muliggør videresendelse af pakker uden at undersøge indholdet af pakker, hvilket gør videresendelse af pakker ret hurtig, fordi det undgår at distribuere tabelopslag og udelukkende afhænger af pakkemærkater. MPLS gør det derfor muligt at oprette komplette kredsløb på tværs af alle typer transportmedier, hvilket er et vigtigt krav til server-til-server-kommunikation på tværs af clouddatacentre.

Som tidligere beskrevet pålægges der forskellige typer trafik i cloudcomputing, og der opstår krav til variantbåndbredde. Uden at overveje MPLS kan det være nødvendigt at bygge separate lag 2-netværk, hvilket helt klart ikke er en skalerbar løsning i clouddatacentre og kan øge både kapital- og driftsomkostninger betydeligt. Med MPLS kan netværk derimod deles ved at oprette virtuelle netværksforbindelser, der kaldes LSP'er (Label Switched Paths). Desuden kan kvaliteten af trafikstrømmene over LSP'erne styres fleksibelt. En sådan trafikkontrol letter servicekvaliteten fra ende til anden (QoS) og giver hurtig netværkskonvergens (ca. 50 ms) i tilfælde af linkfejl, en bemærkelsesværdig forbedring i forhold til STP. Derfor kan gennemsigtigheden af netværksfejl forbedres kraftigt, og tjenesteafbrydelser kan reduceres, hvilket er andre vigtige krav til større robusthed i clouddatacentre.

MPLS gør det også muligt at aktivere en virtuel privat LAN-tjeneste (VPLS) for at udvide lag 2-forbindelsen på tværs af flere datacentre. VPLS er en VPN-teknologi (Virtual Private Network). VPN bruges typisk til at implementere sikre forbindelser mellem LAN'er, der er placeret på forskellige websteder, f.eks. datacentre, der bruger offentlige internetlinks. VPLS gør det muligt for forskellige LAN'er i forskellige datacentre at kommunikere, som om de er ét LAN, hvilket er et vigtigt krav til strømlining af VM-mobilitet. VM-mobilitet kan også drage fordel af den nævnte trafikstyringsfunktionalitet, der tilbydes af MPLS.

Den aktuelle udvikling

Flere leverandører markedsfører nu cloudcentrerede netværk og beregningsprodukter for at løse flere af de designmål, der er angivet tidligere. De fleste af disse produkter er variationer af, hvad du ville finde i et traditionelt datacenter med et ændret fokus på tæthed og samtidige brugere. En datacenterdesigner, der ønsker at understøtte private eller offentlige cloudmiljøer, har et voksende katalog over produkter, du kan vælge imellem.

Datacenterdesign har udviklet sig hurtigt i løbet af de sidste 5 år. denne tendens bliver ikke langsommere. Datacentrene 5 eller 10 år fra nu vil sandsynligvis se meget anderledes ud end datacentrene i dag. Datacenterdesignere håndterer nye krav og forbedrer samtidig effektiviteten og TCO'en for at levere en cloudtjeneste. Med fremkomsten af færdigudviklede modulære datacentre bliver faciliteterne snart udskiftelige komponenter, ligesom it-udstyret selv. For at imødekomme den voksende forbrugerefterspørgsel efter nye cloudbaserede tjenester samt imødekomme eksisterende virksomheders behov for it-infrastruktur vil vi se flere og flere datacentre, hvor hver generation er mere effektiv end sin forgænger.

Feedback

Var denne side nyttig?