Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Diese Checkliste enthält eine Reihe von Empfehlungen, die Sie verwenden können, um die Zuverlässigkeits-, Resilienz- und Fehlerwiederherstellungsstrategien in Ihrem Architekturdesign zu bewerten. Um die Zuverlässigkeit zu gewährleisten, identifizieren Sie die beste Infrastruktur und den besten Anwendungsentwurf für Ihre Workload. Treffen Sie diese Entscheidungen basierend auf Ihren Geschäftlichen Anforderungen, die den Zielmetriken für Verfügbarkeit und Wiederherstellbarkeit zugeordnet sind.
Um ein zuverlässiges Design zu implementieren, sollten Sie Entscheidungspunkte in Ihrem Design gründlich berücksichtigen und wissen, wie sich diese Entscheidungen auf Ihre Arbeitsauslastung auswirken. Diese Checkliste und die zugehörigen Leitfäden stellen Ressourcen bereit, die Ihnen bei der Entscheidungsfindung helfen. Sorgen Sie für die Zuverlässigkeit der Arbeitsauslastung während des gesamten Workloadentwurfs, der Entwicklung und des Betriebslebenszyklus.
Prüfliste
Wenden Sie sich an Ihr Design mit dem Fokus auf Zuverlässigkeit, um sicherzustellen, dass Sie eine Arbeitsauslastung entwerfen, die robust, verwaltbar und wiederholbar ist. Wenn Sie keine Zuverlässigkeitspraktiken einschließen und die Kompromisse berücksichtigen, ist Ihr Entwurf potenziell gefährdet. Berücksichtigen Sie sorgfältig alle in der Checkliste behandelten Punkte, um das Vertrauen in den Erfolg Ihres Systems zu erhöhen.
Programmcode | Empfehlung | |
---|---|---|
☐ | RE:01 | Konzentrieren Sie sich auf Ihre Arbeitsauslastungsgestaltung auf Einfachheit und Effizienz. Verwenden Sie einen praktischen Ansatz, um unnötige Komplexität zu vermeiden, während Sie Ihre Geschäftsziele und -anforderungen erfüllen. |
☐ | RE:02 | Identifizieren und Bewerten von Benutzer- und Systemflüssen. Verwenden Sie eine Kritische Skalierung basierend auf Ihren Geschäftlichen Anforderungen, um die Abläufe zu priorisieren. |
☐ | RE:03 | Verwenden Sie die Fehlermodusanalyse (FMA), um potenzielle Fehler in Ihrer Workload zu identifizieren. Identifizieren Sie Abhängigkeiten und Fehlerpunkte, und entwickeln Sie Entschärfungsstrategien für diese Fehler. |
☐ | AW:04 | Definieren Sie Zuverlässigkeits- und Wiederherstellungsziele für Ihre Workload. Verwenden Sie die Ziele, um Ihr Design und als Grundlage Ihres Gesundheitsmodells zu informieren. |
☐ |
RE:05 RE:05 RE:05 |
Fügen Sie Redundanz auf unterschiedlichen Ebenen hinzu, insbesondere für kritische Abläufe, um Ihre Zuverlässigkeitsziele zu erfüllen. Berücksichtigen Sie redundante Infrastrukturkomponenten wie Compute und Netzwerk sowie mehrere Instanzen Ihrer Lösung. |
☐ | RE:06 | Implementieren Sie eine zeitnahe und zuverlässige Skalierungsstrategie auf Anwendungs-, Daten- und Infrastrukturebene. Basieren Sie auf der Skalierungsstrategie auf tatsächlichen oder vorhergesagten Nutzungsmustern, und minimieren Sie manuelle Eingriffe. |
☐ | RE:07 | Stärken Sie die Resilienz Ihrer Arbeitsauslastung, indem Sie Selbsterhaltungs- und Selbstheilungsmaßnahmen implementieren. Verwenden Sie integrierte Features und bewährte Cloudmuster, damit Ihre Arbeitsauslastung während und bei Vorfällen funktionsfähig bleibt. |
☐ | RE:08 | Testen Sie resilienz- und Verfügbarkeitsszenarien, indem Sie die Prinzipien des Chaos engineering anwenden. Stellen Sie sicher, dass Ihre ordnungsgemäßen Implementierungs- und Skalierungsstrategien effektiv sind, indem Sie aktive Fehlfunktionen und simulierte Auslastungstests durchführen. |
☐ | RE:09 | Implementieren Sie strukturierte, getestete und dokumentierte Geschäftskontinuitäts- und Notfallwiederherstellungspläne (BCDR), die den Wiederherstellungszielen entsprechen. Pläne müssen alle Komponenten und das System insgesamt abdecken. |
☐ | RE:10 | Messen und Modellisieren der Integritätssignale der Lösung. Erfassen Sie kontinuierlich Betriebszeit- und andere Zuverlässigkeitsdaten aus dem gesamten Workload sowie von einzelnen Komponenten und wichtigen Flows. |
Nächste Schritte
Es wird empfohlen, die Zuverlässigkeitskonflikten zu überprüfen, um andere Konzepte zu untersuchen.