❉᭄͜͡بکاپ و زیرساخت شبکـہ از پایـہ تا پیشر؋ـته❉᭄͜͡
· 5 اردیبهشت · خواندن 12 دقیقه »»——☠——« ( قسمت اول ) »——☠——««
چرا بکاپ در عمل یک سامانه است نه یک فایل
بکاپ موفق یعنی توانایی بازگردانی قابل اتکا، در زمان قابل قبول، با حداقل از دست رفتن داده و با مسیر حقوقی و امنیتی روشن. خیلی از سازمان ها «کپی گرفتن» را با «قابلیت بازیابی» اشتباه می گیرند. بکاپ وقتی معنی دارد که این موارد مشخص و اندازه گیری شوند
هدف نقطه بازیابی یا RPO یعنی حداکثر داده ای که می توانید از دست بدهید
هدف زمان بازیابی یا RTO یعنی حداکثر زمانی که می توانید سرویس قطع باشد
دامنه بازیابی یعنی چه چیزهایی باید برگردند، فایل، ماشین مجازی، دیتابیس، کل سایت، یا فقط چند پوشه
اعتمادپذیری یعنی بکاپ ها واقعا قابل خواندن و قابل استفاده باشند، نه فقط «وجود داشته باشند»
امنیت یعنی بکاپ خودش تبدیل به بزرگترین دارایی برای مهاجم نشود
مدل های اصلی بکاپ گیری و تفاوت های واقعی آن ها
فول
کپی کامل از داده در هر نوبت. ساده و قابل فهم است اما زمان و فضا زیاد می خواهد. برای مجموعه های کوچک یا برای «نقطه های مرجع» دوره ای مناسب است.
افزایشی
فقط تغییرات از آخرین بکاپ را می گیرد. سریع و کم حجم است اما برای بازیابی ممکن است به زنجیره چند مرحله ای وابسته باشد. شکست یک حلقه از زنجیره می تواند بازیابی را سخت کند مگر اینکه سیاست های صحت سنجی و نگهداری درست داشته باشید.
تفاضلی
تغییرات از آخرین فول را می گیرد. حجمش از افزایشی بیشتر می شود اما بازیابی معمولا ساده تر است چون به فول به علاوه آخرین تفاضلی نیاز دارید.
تصویر محور یا ایمیج
به جای فایل ها، تصویر کامل دیسک یا ماشین مجازی را می گیرد. برای بازیابی سریع سرویس عالی است، مخصوصا در مجازی سازی. اما برای بازیابی تک فایل ممکن است نیاز به مرور داخل ایمیج باشد.
فایل محور
برای سرور فایل و اشتراک ها کاربردی است و جزئیات فایل ها را خوب مدیریت می کند. اما در بازگردانی کل سرویس ممکن است کندتر از تصویر محور باشد.
بکاپ آگاه از برنامه
برای دیتابیس و برنامه های سازمانی حیاتی است. مثلا بکاپ درست از دیتابیس باید با مفهوم لاگ، سازگاری تراکنشی، و حالت های آنلاین و آفلاین هماهنگ باشد. بکاپ خام از فایل دیتابیس بدون هماهنگی ممکن است غیرقابل بازیابی شود.
اسنپ شات
اسنپ شات معمولا بکاپ نیست. اسنپ شات یک نقطه زمانی سریع روی همان ذخیره ساز است و برای بازگشت فوری عالی است، اما اگر همان ذخیره ساز خراب شود یا رمزگذاری شود، اسنپ شات هم می رود. اسنپ شات را باید همراه با یک کپی مستقل و جدا استفاده کرد.
تکثیر یا رپلیکیشن
برای تداوم خدمت مناسب است اما جای بکاپ را پر نمی کند. چون خطا، حذف اشتباه، یا خرابکاری را هم تکثیر می کند. رپلیکیشن ابزار دسترس پذیری است، بکاپ ابزار بازگشت به گذشته
لایه های ذخیره سازی بکاپ و رسانه های رایج
دیسک محلی
ساده و ارزان اما ریسک بالا دارد چون هم منبع و هم مقصد نزدیک به هم هستند.
ذخیره ساز شبکه ای
NAS برای اشتراک فایل و بکاپ فایل محور رایج است. SAN برای بارهای سنگین و مجازی سازی و دیتابیس مناسب تر است. انتخاب بین NAS و SAN به الگوی دسترسی، تاخیر، و مهارت تیم بستگی دارد.
نوار
برای نگهداری بلند مدت و جداسازی فیزیکی ارزشمند است. هزینه اولیه و فرایند عملیاتی می خواهد، اما برای دفاع در برابر باج افزار و آرشیو قانونی مفید است.
ابر
برای خارج کردن یک نسخه از سایت عالی است. مهمترین نکته ها هزینه خروجی، سیاست نگهداری، رمزنگاری، قفل شدگی ارائه دهنده، و پهنای باند واقعی لینک شماست.
ذخیره سازی شی گرا
برای مقیاس و نگهداری طولانی عالی است. اگر قابلیت تغییرناپذیری فعال شود، یک لایه دفاعی قوی در برابر حذف و رمزگذاری ایجاد می کند.
قاعده های طراحی که در دنیای واقعی جواب می دهند
اصل سه دو یک به زبان ساده
حداقل سه نسخه از داده، روی حداقل دو نوع رسانه، و حداقل یک نسخه خارج از محل. اگر باج افزار و خطای انسانی را جدی بگیرید، بهتر است یک نسخه کاملا جدا یا غیرقابل تغییر هم داشته باشید.
تفکیک حوزه ها
حساب کاربری بکاپ، سرور بکاپ، و مخزن بکاپ باید از دامنه دسترسی کاربران عادی جدا باشد. اگر مدیر دامنه آلوده شود، بکاپ هم معمولا هدف بعدی است.
کمترین سطح دسترسی
مخزن بکاپ نباید با دسترسی نوشتن عمومی در شبکه دیده شود. بهتر است مسیرهای نوشتن محدود به سرویس بکاپ و به شکل کنترل شده باشد.
رمزنگاری و مدیریت کلید
رمزنگاری بدون مدیریت کلید امن، فقط ظاهر امنیت است. کلیدها باید جایی جدا، با دسترسی محدود، و با نسخه پشتیبان مستقل نگهداری شوند. از ذخیره کلید روی همان سروری که بکاپ می گیرد اجتناب کنید.
تغییرناپذیری و قفل زمان دار
اگر امکانش را دارید، از مخزن های دارای قفل زمانی استفاده کنید تا حتی با دسترسی مدیریتی هم نتوان بکاپ های اخیر را پاک کرد.
انواع سرور در معماری بکاپ و شبکه و نقش هر کدام
سرور بکاپ
مغز سیاست ها، زمان بندی، کاتالوگ، و بازیابی. باید منابع پردازشی کافی، دیسک سریع برای کاتالوگ، و شبکه قابل اتکا داشته باشد. بهتر است روی آن سرویس های غیرمرتبط نصب نشود.
سرور مخزن یا ریپازیتوری
جایی که داده بکاپ می نشیند. ممکن است یک ذخیره ساز جدا یا یک سرور با دیسک های زیاد باشد. طراحی آن باید بر اساس نرخ ورود داده، پنجره بکاپ، و الگوی بازیابی انجام شود.
سرور پروکسی یا انتقال
در مجازی سازی، پروکسی ها بار خواندن را از میزبان ها می گیرند و مسیر داده را بهینه می کنند. در شبکه های بزرگ، وجود لایه پروکسی می تواند تفاوت بین بکاپ پایدار و بکاپ شکست خورده باشد.
سرور فایل
بیشترین نرخ تغییر فایل های کوچک و دسترسی کاربران را دارد. برای آن، ترکیب سیاست های نسخه بندی فایل، بکاپ فایل محور، و اسنپ شات کوتاه مدت بسیار کاربردی است.
سرور دیتابیس
نیازمند بکاپ سازگار تراکنشی است. معمولا ترکیبی از بکاپ کامل، بکاپ افزایشی یا تفاضلی، و بکاپ لاگ در فاصله های کوتاه لازم است تا RPO پایین تامین شود.
سرور برنامه و وب
بکاپ فقط از فایل ها کافی نیست. پیکربندی، رازها، گواهی ها، متغیرهای محیطی، و وابستگی ها باید مستندسازی و نسخه برداری شوند. برای برنامه های مدرن، بکاپ از پیکربندی و زیرساخت هم مهم است.
سرور مجازی سازی
در اینجا تمرکز روی بکاپ ایمیج ماشین ها، هماهنگی با ابزارهای اسنپ شات، و کنترل رشد فضای اسنپ شات هاست. همچنین باید برنامه ای برای بازیابی در سطح میزبان و کلاستر داشته باشید.
سرور احراز هویت و نام
خرابی سرویس نام یا احراز هویت می تواند بازیابی را فلج کند. پشتیبان گیری از تنظیمات، پایگاه داده ها، و روش بازیابی اضطراری حساب های مدیریتی اهمیت زیادی دارد.
کلاینت ها و ایجنت ها و اینکه چرا انتخابشان مهم است
کلاینت بدون ایجنت
برای بعضی سناریوهای فایل محور یا اشتراک شبکه ساده است، اما معمولا کنترل سازگاری برنامه ها و جزئیات سیستم عامل محدودتر است.
کلاینت با ایجنت
اجازه می دهد بکاپ برنامه محور، فیلترهای دقیق، کنترل منابع، و بازیابی در سطح سیستم بهتر انجام شود. عیبش نگهداری نسخه ایجنت، سازگاری، و سطح دسترسی لازم روی سرورهاست.
کلاینت های کاربر نهایی
لپ تاپ و دسکتاپ ها معمولا خارج از شبکه هستند و پراکندگی دارند. برای این ها باید به بکاپ مبتنی بر اینترنت، سیاست رمزنگاری، و کنترل پهنای باند فکر کنید. اگر داده حیاتی روی کلاینت هاست، نبود این لایه یعنی سوراخ بزرگ در معماری.
مودم، روتر، سوئیچ و تاثیرشان روی بکاپ و بازیابی
مودم و دسترسی اینترنت
نوع اتصال تعیین می کند بکاپ خارج از سایت چقدر واقع بینانه است. اگر اتصال ناپایدار باشد، باید راهکارهای صف بندی، از سرگیری انتقال، و محدودسازی ساعات انتقال را داشته باشید. برای لینک های سلولی باید هزینه و محدودیت حجم را جدی بگیرید.
روتر
نقش روتر فقط اینترنت نیست. روتر می تواند جداسازی شبکه ها، کیفیت سرویس، و تونل های امن را مدیریت کند. برای بکاپ، این موارد مهم است
جداسازی ترافیک بکاپ از ترافیک کاربر
محدودسازی مسیرهای دسترسی به مخزن بکاپ
پیاده سازی ارتباط امن سایت به سایت برای بکاپ خارج از محل
جلوگیری از انتشار حمله از یک بخش شبکه به بخش بکاپ
سوئیچ
سوئیچ های لایه دو و لایه سه روی عملکرد بکاپ اثر مستقیم دارند، مخصوصا وقتی حجم زیاد است. نکات کلیدی
شبکه های مجازی برای جداسازی ترافیک بکاپ
ظرفیت حقیقی پورت ها و تجمیع لینک در صورت نیاز
کنترل طوفان ترافیکی و حلقه های لایه دو
کیفیت کابل کشی و خطاهای فیزیکی که باعث بکاپ های ناقص می شود
ریموت و دسترسی راه دور، هم ابزار نجات هم درگاه خطر
پروتکل ها و روش ها
دسترسی راه دور معمولا با پوسته امن، دسکتاپ راه دور، یا ابزارهای مدیریت راه دور انجام می شود. هر کدام باید پشت یک لایه کنترل هویت قوی و ثبت رویداد باشد.
الگوی امن برای مدیریت
به جای باز کردن مستقیم سرویس های مدیریتی به اینترنت، از این معماری ها استفاده می شود
شبکه خصوصی مجازی با احراز هویت چندمرحله ای
سرور میانی یا باستین که فقط از آنجا اجازه دسترسی مدیریتی می دهد
محدودسازی بر اساس نشانی ها و نقش ها
ثبت کامل نشست ها و فرمان ها در صورت امکان
ارتباط ریموت با بکاپ
اگر مهاجم از مسیر ریموت وارد شود، هدف بعدی او معمولا سرور بکاپ است. بنابراین دسترسی مدیریتی به سامانه بکاپ باید جداگانه، سخت گیرانه، و حتی المقدور با حساب های اختصاصی و دستگاه های مورد اعتماد انجام شود.
ابزارهای مکمل که اغلب نادیده گرفته می شوند
برق و تداوم
منبع تغذیه بدون وقفه فقط برای خاموشی نیست، برای جلوگیری از خرابی داده و کاتالوگ بکاپ هم مهم است. خاموشی ناگهانی در لحظه نوشتن بکاپ می تواند مخزن را ناسازگار کند.
مدیریت سخت افزار
کنترلرهای مدیریت از راه دور سرورها برای بازیابی وقتی سیستم عامل بالا نمی آید حیاتی هستند، اما اگر ایمن نشوند، یک نقطه نفوذ جدی اند. باید جدا از شبکه عمومی مدیریت شوند و رمزها و دسترسی ها کنترل شوند.
پایش و ثبت رویداد
بکاپ بدون مانیتورینگ یعنی شکست های بی صدا. باید حداقل این ها پایش شوند
موفقیت یا شکست کارها
زمان اجرا و انحراف از الگو
رشد حجم بکاپ و نرخ تغییر
سلامت دیسک ها و ظرفیت آزاد
وضعیت ارتباط خارج از سایت
مدیریت پیکربندی و مستندسازی
برای بازیابی سریع، باید بدانید چه چیزی را به چه ترتیبی برمی گردانید. مستندات شامل نقشه شبکه، نقش سرورها، وابستگی سرویس ها، نام ها و نشانی ها، و مراحل بازگردانی باید به روز و در دسترس باشد.
طراحی سیاست نگهداری و چرخه عمر بکاپ
نگهداری کوتاه مدت
برای خطاهای روزمره، حذف اشتباه، و بازگشت سریع. معمولا تعداد زیادی نقطه زمانی نزدیک نیاز است.
نگهداری میان مدت
برای رخدادهای عملیاتی و حسابرسی. فاصله نقاط زمانی بیشتر می شود.
نگهداری بلند مدت و آرشیو
برای الزامات قانونی یا تاریخی. اینجا هزینه نگهداری، قالب داده، و امکان خواندن در سال های بعد مطرح است. آرشیو را از بکاپ عملیاتی جدا ببینید.
پاکسازی امن
پاک کردن بکاپ فقط حذف فایل نیست. برای داده حساس، باید سیاست پاکسازی امن و کنترل دسترسی به رسانه های خارج شده از چرخه داشته باشید.
کارایی و مهندسی ظرفیت، از حدس تا عدد
پنجره بکاپ
باید بدانید در چه بازه ای می توانید بار بکاپ را اجرا کنید بدون اینکه سرویس ها مختل شوند. اگر پنجره محدود است، روش های افزایشی، تغییر بلوکی، و پروکسی های بیشتر کمک می کنند.
نرخ تغییر داده
مهمترین عامل هزینه و ظرفیت است. دو سیستم با حجم برابر، اگر نرخ تغییرشان متفاوت باشد، نیاز کاملا متفاوتی دارند.
پهنای باند و تاخیر
برای بکاپ خارج از سایت، تاخیر و نوسان لینک به اندازه سرعت خام مهم است. راهکارهایی مثل فشرده سازی، رفع تکرار، و ارسال مرحله ای می تواند کمک کند، اما همه چیز را جادویی حل نمی کند.
امنیت بکاپ در برابر باج افزار و تهدیدات داخلی
جداسازی منطقی و فیزیکی
هرچه بکاپ از دامنه دسترسی روزمره دورتر باشد، احتمال نابودی همزمان کمتر می شود.
حساب های ویژه و جداسازی نقش ها
ادمین بکاپ نباید همان ادمین همه چیز باشد. جدا کردن نقش ها و استفاده از حساب های موقت یا زمان دار، سطح ریسک را کم می کند.
شبکه اختصاصی بکاپ
در سازمان های بزرگ، جدا کردن شبکه بکاپ باعث کاهش شلوغی و کاهش سطح حمله می شود.
صحت سنجی و تمرین بازیابی
بهترین دفاع این است که بدانید می توانید برگردید. تمرین بازیابی باید زمان بندی شود و نتایجش ثبت شود، شامل اینکه چه چیزی برگشت، چقدر طول کشید، و چه موانعی وجود داشت.
سناریوهای بازیابی که باید از قبل طراحی شوند
بازیابی فایل کاربر
سریع، پرتکرار، و باید تا حد ممکن خودکار و ساده باشد.
بازیابی ماشین مجازی یا سرور
هدف معمولا بازگردانی سرویس در کمترین زمان است. سپس بعدا بهینه سازی و پاکسازی انجام می شود.
بازیابی دیتابیس
نیازمند ترتیب درست فول و لاگ و کنترل سازگاری است. باید سناریوی خطای انسانی و سناریوی خرابی دیسک و سناریوی خراب شدن منطقی داده را جداگانه تمرین کنید.
بازیابی سایت پس از حادثه
اینجا شبکه، نام، احراز هویت، ذخیره سازی، و ترتیب روشن کردن سرویس ها تعیین کننده است. اگر اولویت سرویس ها از قبل مشخص نباشد، بازیابی به آشفتگی تبدیل می شود.
الگوهای مدرن و نوین که ارزش بررسی دارند
بکاپ به عنوان کد
سیاست ها و پیکربندی بکاپ را تا حد ممکن قابل نسخه بندی و قابل بازتولید کنید. این کار خطای انسانی را کم می کند و تکرارپذیری را بالا می برد.
تغییرناپذیری در لایه ذخیره سازی
قفل های زمانی و نسخه بندی شی گرا، یک لایه دفاعی بسیار موثر می سازد.
جداسازی محیط تولید و بکاپ
هرچه اتصال های مستقیم کمتر و کنترل شده تر باشد، احتمال اینکه حادثه تولید بکاپ را هم نابود کند کمتر است.
معماری چند مقصدی
یک مقصد سریع برای بازیابی روزانه، یک مقصد جدا برای تاب آوری، و یک مقصد بلند مدت برای آرشیو. این رویکرد هزینه را هدفمند می کند.
اشتباهات رایج که پروژه های بکاپ را شکست می دهند
ذخیره بکاپ روی همان سرور یا همان ذخیره ساز بدون نسخه مستقل
باز گذاشتن مخزن بکاپ در شبکه با دسترسی نوشتن برای همه
اتکا به اسنپ شات به عنوان تنها راه بازگشت
نداشتن آزمون بازیابی و اعتماد به گزارش موفقیت
نداشتن تصویر روشن از اولویت سرویس ها
بی توجهی به بکاپ از پیکربندی ها، گواهی ها، و رازها
نداشتن برنامه برای کاربرانی که خارج از شبکه اند
نداشتن مانیتورینگ ظرفیت و پر شدن ناگهانی مخزن
جمع بندی اجرایی برای یک طرح قابل پیاده سازی
اگر بخواهید یک طرح عملیاتی بسازید، به جای اینکه از ابزار شروع کنید، از اهداف شروع کنید
سرویس ها را دسته بندی کنید بر اساس حیاتی بودن و RPO و RTO
برای هر دسته، روش مناسب را انتخاب کنید فایل محور، ایمیج، برنامه محور
حداقل یک نسخه خارج از محل یا جدا از شبکه تولید داشته باشید
تغییرناپذیری و جداسازی دسترسی را برای دفاع در برابر باج افزار جدی بگیرید
مانیتورینگ و گزارش و آزمون بازیابی را به عنوان بخش اصلی پروژه تعریف کنید نه کار اضافی
نقش شبکه را در نظر بگیرید مودم و لینک، روتر و جداسازی، سوئیچ و ظرفیت، و دسترسی راه دور امن
