מה זה DRP ולמה אתם חייבים להכיר את זה?

מערכות המחשוב בעסקים, הן כמעט תמיד רכיב קריטי בפעילותם השוטפת. משמע - רכיב שחשוב מאוד שלא יפסיק לפעול וכמו כן, שיספק רמת ביצועים מינימאלית מסוימת. עם זאת, גם במערכות מחשוב איכותיות, אשר מתוכננות, מוקמות ומנוהלות היטב, מתרחשים מדי פעם מצבי משבר בלתי צפויים. המענה הקלאסי לכך, הוא DRP. במה בדיוק מדובר ומדוע חיוני להכיר זאת?

מה הוא DRP

DRP הם ראשי התיבות של הביטוי Disaster Recovery Plan או תכנית התאוששות מאסון. כל עסק שמתנהל באופן מקצועי וחכם, מכין לעצמו מראש תכניות מפורטות מסוג זה ומטבע הדברים, בתחום המחשוב העסקי יש בכך צורך נרחב. זאת, הן לאור מורכבותו הרבה שמזמינה כשלים שונים והן לאור חשיבותו העסקית הרבה כיום.

ההבדל ביחס ל-BCP

עוד מונח חשוב, ששומעים פעמים רבות בהקשר DRP, הוא BCP או Business Continuity Planning. במה מדובר ומה ההבדל בין השניים? DRP מתייחס בעיקר להתאוששות הטכנית ממקרה של כשל. BCP לעומתו, עוסק בהבטחת המשך הפעילות העסקית מול כל מקרי הכשל (לא רק מבוססי מחשוב), כולל מניעת מקרים כאלה (או לכל הפחות, מניעת או צמצום נזקיהם). כתוצאה מכך, BCP הוא נושא יותר רחב, אסטרטגי וקריטי עבור עסקים. DRP רק נגזר ממנו, מאחר שהשיקולים העסקיים הם שמכתיבים את סדרי העדיפויות. כמובן, תכניות BCP וגם DRP צריכות להיות מגובשות באמצעות שת"פ הדוק של ההנהלה ואגף מערכות המידע, כחלק מטיפול שיטתי בנושא ניהול הסיכונים. דוגמא להמחשה: אם מערכת מחשוב מסוימת נמצאת במצב של כשל טוטאלי עקב שריפה מקומית, ייתכן ששיקומה (על פי תכנית ה-DRP) ייקח כמה שעות. למרות זאת, הפעילות העסקית שמבוססת עליה תשובש רק לשניות בודדות, בזכות מעבר מהיר למערכת חלופית שהוכנה מראש, כפי שהוגדר בתכנית BCP. עוד דוגמא: תקלה במערכת שמעדכנת לקוחות במידע חשוב, תטופל במהירות האפשרית, בזכות תכנית DRP. במקביל, ישנה הפרעה רחבה לפעילות מהיבטה העסקי – לקוחות מציפים את מוקדי השירות בשאלות, מתלוננים ברשתות החברתיות, מתחילים להתעניין בשירותי מתחרים. היבט זה יטופל לפי תכנית ה-BCP, למשל על ידי עדכון הלקוח בשיחת טלפון יזומה ("בדרך כלל אנחנו שולחים SMS, אבל בגלל תקלה זמנית אנחנו מתקשרים לעדכן אתכם אישית").

החשיבות העסקית

כיום, התחרות העסקית היא לרוב רבה ולא פשוטה. עולם המחשוב מספק לעסקים כלים רבים להתבלט מבחינה זו, אך כלים אלה זמינים לכולם – גם למתחרים. השורה התחתונה, היא שמבחינת מחשוב, עסקים נדרשים לכל הפחות שלא להישאר מאחור. כלומר, לפחות לעמוד ברף הביצועים של מתחריהם. בפועל, זה אומר שכשלי מחשוב אשר מתבטאים בהשבתה מתמשכת של שירותים ללקוח, פוגעים משמעותית בתדמית העסק. אם מדובר בחברה בולטת, הדבר מגיע פעמים רבות גם לעיתונים. ברישות החברתי, סביר שהוא בכל מקרה יקבל ביטוי מהיר ולעתים גם נרחב.

מה נדרש

כשלים נרחבים במערכות המחשוב, למשל עקב אסון טבע, עשויים לפגוע גם במערכות המחשוב, בהן העסק יכול להשתמש עבור ההתאוששות עצמה. למשל, מדיות גיבוי שנשמרות פנימית בעסק, עלולות להיפגע בעצמן בשעת משבר. המסקנה פשוטה וברורה מאליה: את הגיבוי, כמו גם את מנגנוני ההתאוששות, כדאי להוציא אל מחוץ לעסק.

ואכן, שירותי עזר בתחום זה מסייעים לארגונים לגבות את המידע שלהם לשרת מרוחק, לנטר מצב מערכות מחשוב לשם זיהוי כשל ואף להתאושש ממנו במהירות. שירותים מסוג זה, נותנים מענה בין השאר לניהול הגיבוי, הגנה עליו ובדיקה של תקינותו. מצד התאוששות, הם מספקים מנגנון ניהול התאוששות קל ונוח לשימוש, אשר לא יסרבל ויעכב בשעת חירום וכן אפשרות למעבר מהיר לשרת חלופי.

כמה דגשים חשובים

הצורך בהתאוששות הוא דבר יוצא דופן. שירות הגיבוי לעומת זאת, הוא דבר שנדרש באופן שוטף ולכן חשובה היכולת לשלם עליו לפי היקף השימוש. בנוסף, מאחר שמדובר בתהליכים קריטיים לשרידות העסק, חשוב לתת דגש מיוחד לתיאום ציפיות ברור מול נותן השירות. זאת, בעזרת הסכם שירות (SLA) אשר יתייחס למדדים אובייקטיבים. לשם ההמחשה, אלה הם שני מדדים בסיסיים וקלאסיים לנושא ההמשכיות העסקית: RPO או Recovery Point Objectives מתייחס למרווחי הזמן בין גיבוי לגיבוי, עליהם מחליטים מראש. RTO או Recovery Time Objectives, מתייחס מספרית לזמן ההתאוששות המבוקש, עבור תהליכים עסקיים ספציפיים.

לתרגל מבעוד מועד

היבט חיוני של נושא ה-DRP, הוא ביצוע שוטף של תרגולים ובדיקות. הרעיון פשוט: לא תרצה לגלות רק בשעת חירום, שהיבט טכני זניח כלשהו מסבך את העניינים ומפריע להתאוששות. מוטב כמובן לגלות דברים כאלה ולטפל בהם מראש. זאת, באמצעות ביצוע יזום של בדיקות – הן של שחזור גיבויים נקודתי והן של התאוששות רחבה של מערכות. בדיקות אלה, הן לא רק ברמה טכנית אלא גם ברמת הנהלים הארגוניים, אשר הוגדרו בתכניות ההתאוששות מאסון.

אבטחה

עוד היבט משנה חשוב של DRP, הוא נושא האבטחה. יש לוודא שגיבויים נקיים מנוזקות וגם מוגנים מפניהן. אחרת, ייתכן מצב שבו מנסים להתאושש מהתקפת נוזקה, בעזרת גיבוי שנגוע בעצמו בנוזקה זו! מערכות הגיבוי וההתאוששות, גם פנימיות בעסק וגם אצל ספק חיצוני, צריכות להיות מאובטחות, גם ובמיוחד מבחינת הרשאות ובקרת גישה. עוד נזכיר, שבנושא האבטחה כמו גם בנושא הפרטיות שקרוב אליו פעמים רבות, ישנם תקנים שבהם נדרשים לעתים לעמוד.

לסיכום

כל עסק מודרני, במיוחד כזה שמיישם מערכות מחשוב או שירות לקוחות בהיקף נרחב, חייב לעצמו טיפול איכותי בנושא ה-DRP. טיפול כושל בכך, עלול להביא לקריסת העסק. טיפול איכותי לעומת זאת, יבטיח "שקט תעשייתי".