שתף באמצעות


מוכנות אירוע Microsoft Azure עבור מרכז המעורבות של Microsoft (מרכז השירותים)

כאשר אירוע Azure מוצהר, אנו מודיעים עדכונים למנויים או לדיירים המושפעים באמצעות Blade של בעיות שירות ב- Azure Service Health (בתוך פורטל Azure).

לפני אירוע

אנו ממליצים על השלבים הבאים כדי להיות מוכנים ולעזור בהגנה על הארגון שלך:

קבל הודעה והישאר מעודכן עבור אירועים שמשפיעים על שירותי Azure שלך

  1. הכר את Azure Service Health בפורטל Azure – המקום שבו אתה נמצא במקרה של בעיות.

  2. קבע את תצורת ההתראות של תקינות השירות כדי להודיע לך על בעיות – בדואר אלקטרוני, ב- SMS, ב- webhook ועוד ברמת המנוי, לפי שירות או לפי אזורים.

    • סוג ההודעה של בעיות שירות יתריע על כך שהשירותים שלך מושפעים מ אירועי שירות.

    • סוג ההודעה בנושא בנושא אבטחה מינורית יתריע על הארגון שלך כי השירותים שלך מושפעים מתקרית אבטחה או מקרה פרטיות.

    להלן המלצות לתצורות התראה בסיסיות:

    • עבור בעיות שירות, סוגים מינורית של תחזוקה מתוכננת ותקינות :

      • עומסי העבודה הקריטיים שלך – הגדר התראות עבור המנויים והשירותים שלך שיפעלו עם עומסי העבודה הקריטיים שלך.
      • הגדר התראות עבור שירותים בסיסיים במחסנית Azure:
        • שירות "תשתית רשת" – שכבה בסיסית במחסנית Azure שכל סוגי עומסי העבודה והיישומים מ- IaaS ל- SaaS מסתמסים עליו.
        • שירות "פורטל Microsoft Azure" – שירות בסיסי המשמש לניהול משאבים של Azure. הרב-תכליתיות שלו ממקם אותה כשירות "catch-all", המכסה מגוון תרחישים, משפיעים על חוויות סיכום אשר יופעלו במסגרת שירות זה.
    • עבור סוג בעיות מינורית של אבטחה:

      • כל המנויים והשירותים של Azure – בדרך כלל יעד(ים) גרוע(ים) של משאבים פחות בשימוש, ולכן חשוב שסוג זה של התראה מכסה את כל משאבי Azure

    בנוסף, פתרון Azure Monitor Baseline Alerts מספק הדרכה וקוד מקיפים ליישום תוכנית בסיסית של התראות פלטפורמה וכן התראת תקינות שירות באמצעות מדיניות ויוזמות בסביבות Azure, עם אפשרויות לפריסה אוטומטית או ידנית.

  3. ודא שלתפקידים הבאים יש את פרטי הקשר המתאימים ובדיקה קבועה כדי להישאר מעודכן. לקבלת מידע נוסף, עיין בהישאר מעודכן לגבי בעיות אבטחה ב- Azure - Azure Service Health | Microsoft Learn

  4. שקול להשתמש בהתראות תקינות או באירועים מתוזמנים כדי להישאר מעודכן לגבי בעיות ספציפיות כך שאנשים ומערכות שלך יוכלו לקבל מידע על בעיות ספציפיות ואירועי תחזוקה קרובים.

כדי להבין את עקרונות התקשורת של Azure, עיין בנושא ההשקה של חוויית ההנתקות - אוטומציה, תקשורת ושקיפות | בלוג ועדכונים של Azure | Microsoft Azure.

הגדלת האבטחה והתאימות שלך כדי להימנע או למזער את ההשפעה של אירועים

  1. סקור ויישם את שיטות העבודה המומלצות לאבטחה תפעולית להגנה על הנתונים, היישומים ונכסים אחרים שלך, במיוחד:

    • אכוף אימות רב-גורמי כדי להקל על חששות לגבי חשיפה.

    • יישם התראות עבור משתמשים בעלי סיכון גבוה. קבע את תצורת הגישה המותנה כדי להבטיח שאתה תקבל הודעה כאשר קיים "משתמש מסוכן" בסביבה שלך.

    • שלוט בתנועה של מנויים ממדריכי כתובות ומ- אל ספריות. למטרות פיקוח, מנהלי מערכת כלליים יכולים לאפשר או לא לאפשר למשתמשים במדריך הכתובות לשנות את מדריכי הכתובות שאינם ידועים בארגון שלהם. פעולה זו מבטיחה שלארגון שלך יש ניראות מלאה של המנויים המשמשים תחת מדריכי הכתובות של הארגון שלך ומונעת מעבר של מנויים שעלולים לעבור אל מדריך כתובות לא ידוע.

  2. מטב את המהימנות והאבטחה של עומס העבודה הקריטי באמצעות Azure Well-Architected Framework (WAF) ו- Review. בנוסף, מומלץ לשקול פעולות אלה כדי להחמיא את העבודה ב- WAF.

    • השתמש בחוברת העבודה של המהימנות, המשולבת בפורטל Azure תחת להב של Azure Advisor, כדי לסקור את יציבות המהימנות של היישומים שלך, להעריך סיכונים ושיפורים בתכנון.

    • הרחב עומס עבודה/ פריסות חוצות אזורים עבור המשכיות עסקית ושחזור מאסון (BCDR). השתמש ברשימה המלאה של זוגות אזורים של Azure שפורסמו.

    • הרחב עומס עבודה/פריסות בתוך אזור בין אזורי זמינות.

    • שקול בידוד עבור מחשבים וירטואליים ב- Azure - מחשבים וירטואליים של Azure | Microsoft Learn עבור עומסי עבודה קריטיים לעסק.

    • שקול תצורות תחזוקה עבור היכולת לשלוט ולנהל עדכונים עבור מחשבים וירטואליים רבים של Azure

    • השתמש ב- Azure Chaos Studio כדי להעריך את חוסן האפליקציות של Azure. כפוף לאפליקציות Azure שלך לת תקלות מבוקרות, אמיתי או מדומה, כדי לבחון את החוסן של האפליקציות ותגובה לשיבושים כגון השהיה ברשת, תקלות באחסון, סודות שתוקפו פג והיתה תקלה במרכז הנתונים.

    • השתמש בחוברת העבודה של הוצאה מכלל שימוש של השירות, המשולבת בפורטל Azure תחת הלהב של Azure Advisor, כתצוגה מרוכזת אחת של הוצאה משימוש של השירות. הוא עוזר לך להעריך את ההשפעה, להעריך אפשרויות ולתכנן את ההעברה משירותים ותכונות שיצאו מ להשתמש בהם.

פעל בהתאם לבלוג המהימנות המתקדמים של Azure כדי להתעדכן במאמצי Azure במאמצי גמישות מתמשכת.

במהלך אירוע

כאשר מנויי המפתח שלך מושפעים על-ידי מקרה, חשוב לדעת היכן וכיצד למצוא את התקשורת הרלוונטית סביב מקרה זה:

  1. עיין בהתראות של Azure Service Health בפורטל Azure לקבלת העדכונים האחרונים מההנדסים שלנו.

    • חשוב לציין כי אנשי קשר של תפקיד ספציפי המוזכרים בסעיף 'לפני אירוע' (מנהל מנוי / בעלים, איש קשר טכני / פרטיות, מנהל דיירים) עשויים גם לקבל הודעות דואר אלקטרוני עבור אירועי אבטחה או פרטיות.
  2. אם קיימות בעיות בגישה לפורטל, בדוק את דף המצב הציבורי Azure azure.status.microsoft כגיבוי.

  3. אם קיימות בעיות בדף 'מצב', בדוק אם קיימים עדכונים באמצעות @AzureSupport ב- "X" (לשעבר Twitter).

מדוע להשתמש בתקינות השירות במקום בדף המצב הציבורי?

לקוחות רבים בודקים את דפי המצב שלנו הנגישים לציבור ( כגון azure.status.microsoft) בסימנים הראשונים לבעיות פוטנציאליות, כדי לראות אם קיימות בעיות ידועות עם שירותי הענן שלנו. עמודים אלה מציגים רק בעיות נרחבות שעומדות בקריטריונים מסוימים, ולא מקרים קטנים יותר שמשפיעים על פחות לקוחות.

Azure Service Health (בתוך פורטל Azure) יודע אילו מנויים ו דיירים אתה מנהל, כך שהוא מציג תצוגה מדויקת הרבה יותר של בעיות מוכרות המשפיעות על ההנתקות שלך. הוא גם מאפשר לך לקבוע תצורה של התראות, כך שתוכל לקבל הודעה באופן אוטומטי.

מתי כדאי לפתוח מקרה תמיכה?

אם מקרה השירות כבר מתעדכן באמצעות תקינות השירות, כל המידע העדכני ביותר יינתן כאן, ולא יהיה צורך לפתוח בקשת תמיכה. אם אתה סבור שאתה מושפע מ מקרה שירות אך אינך רואה את הבעיה המיוצגת בדף תקינות השירות, פתח בקשת תמיכה.

אם קיימות שאלות שלא נכללו בחומרים של בעיית אבטחה שהתקבלו, פתח בקשת תמיכה המפנה אל מזהה המעקב.

לאחר מקרה

  1. קרא את Post Incident Review (PIR)מתוך חלונית היסטוריית התקינות של Azure Service Health (או באמצעות התראות תקינות שירות שתצורתן נקבעה על-ידי הלקוח) כדי להבין מה למדנו.

  2. עבור מקרים עיקריים שענו על הקריטריונים שלנו בדף המצב הציבורי, הצטרף למחזור חיים של Azure Incident Retrospective כדי לקבל תשובות לשאלות, או צפה בהקלטה.

  3. אם אתה סבור שאתה זכאי לזכאי ב- SLA, צור בקשת תמיכה חדשה עם סוג בעיה מסוג 'בקשת החזר' - וכלול את מזהה המעקב אחר אירוע.