Россия, Москва, РОСНОУ |
Работа с группами хранения
Планирование групп хранения
В большей части операций по установке, будь то миграция (переход) из старых систем или новые инсталляции, планированию уделяется наименьшее внимание. Мы готовы сколь угодно повторять, что недостаточное планирование приводит к низкому уровню реализации и увеличению затрат на администрирование в долгосрочной перспективе. Если бы вы записывали виды своей деятельности по администрированию каждый день в течение месяца и затем просматривали их, то, вполне возможно, пришли бы к выводу, что при лучшем планировании и реализации можно снизить объем производимых работ на 50 процентов или больше. Разумеется, многие станут ссылаться на отсутствие времени для исчерпывающего планирования. Но если осуществить тщательное планирование, то дело кончится тем, что сэкономленное время будет потрачено на непредвиденные трудности, вызванные переходом на систему Exchange Server 2003.
Образцовое администрирование сети
Мы знаем одного администратора Exchange, который регулярно выполняет следующие действия. Основываясь на своей ежедневной деятельности и планируя профилактические средства, чтобы избежать "острых ситуаций", он разработал приведенный ниже список. Естественно, что его сеть Exchange работает без сбоев, и он готов к любой возможной аварии. Некоторым из читателей книги эти задачи покажутся чрезмерными. Но мы уверены, что, изучив эти шаги, вы измените свое мнение. Мы думаем, что это как раз пример отличного администрирования.
Ежедневно он проверяет свои журналы – абсолютно все. Он просматривает журналы приложений, безопасности, системный журнал, журнал каталогов и другие журналы. Если он видит любые предупреждения или уведомления, он помечает их и по возможности решает эти проблемы в тот же день. Он также проверяет каждый день журналы программ резервного копирования, чтобы убедиться в успешном завершении резервного копирования. Он выполняет наращиваемое (инкрементальное) резервное копирование каждый день, кроме пятницы. Кроме того, он запускает монитор серверов (Server Monitor) для критических служб на своих серверах Exchange и отправляет каждый час возвращаемые сообщения монитора соединений (Link Monitor) постоянным поставщикам и заказчикам своей компании. (Возвращаемые сообщения направляются в общей сложности восьми SMTP-серверам интернета.) При неисправности соответствующего канала он зачастую узнает об этом раньше, чем кто-либо еще, и может найти неисправность и (иногда) устранить ее раньше, чем пользователи вообще узнают о каких-то неполадках. (Подробнее о мониторе соединений и мониторе серверов будет рассказано в лекции 7 "Функциональность, безопасность и поддержка Exchange Server 2003".)
Еженедельно он выполняет полное резервное копирование всех своих серверов и в понедельник убеждается, что копирование прошло успешно. Если нет, то он запускает в понедельник новое полное резервное копирование, когда уходит с работы. Он также проверяет наличие обновлений по антивирусным программам и использует программное обеспечение своей сети для обновления своих серверов и рабочих станций своих пользователей.
Каждый месяц он получает серию диаграмм оснастки System Monitor, регистрирует виды операций и затем печатает отчет для каждого сервера, помещая его в постоянно наращиваемую записную книжку. Эти диаграммы отражают состояние его серверов, и они измеряются в течение трех дней через 10-минутные интервалы. С помощью этих диаграмм он прогнозирует, как повлияет добавление какой-либо службы или новой группы пользователей на каждый из этих серверов. И когда он запрашивает у руководства компании новое оборудование, то у него есть числовое обоснование и достоверные сведения, чтобы подкрепить свой запрос.
Кроме того, каждый месяц он выполняет пробное восстановление для каждого используемого ленточного устройства резервного копирования. Поскольку резервное копирование выполняется для трех различных серверов, он выполняет три пробных восстановления. Вот как он это делает. Он берет 15% информации, для которой выполняется резервное копирование, и копирует ее в другое место того же сервера. Часто он создает временную папку с именем Test. Затем он получает резервную копию этой папки, записывая ее размер и количество файлов. После окончания операции резервного копирования и проверки он удаляет папку Test и затем восстанавливает ее с резервной копии на ленте. По окончании операции восстановления он сравнивает размер и количество файлов восстановленной папки со значениями, записанными для исходной папки Test. Если они совпадают, то он считает, что система резервного копирования на ленту работает правильно. Если нет, он начинает поиск и устранение неисправностей.
Раз в месяц он восстанавливает свои базы данных Exchange на автономном сервере, который сконфигурирован приблизительно так же, как и его эксплуатируемый сервер. Затем он проверяет, что его базы данных действуют на автономном сервере. Эта проверка позволяет убедиться, что он может выполнять полное восстановление быстро и эффективно, и его система резервного копирования находится в работоспособном состоянии. Учиться восстановлению нужно до того, как "грянет гром" и придется сидеть на телефоне, непрерывно консультируясь со службой технической поддержки Microsoft. Лучше делать это, когда все спокойно, и можно позволить себе ошибки, работая на автономном сервере.
Кроме того, с периодичностью от четырех до шести недель он предлагает конечным пользователям обучение – обычно по вопросам, которые преобладали, когда пользователи обращались к нему за поддержкой. Использование этого подхода к "обслуживанию заказчиков" привело к устойчивому снижению количества обращений в службу технической поддержки, поскольку у него появились пользователи, которые стали лучше разбираться в системе и самостоятельно выполнять некоторые базовые операции, связанные с поиском и устранением неисправностей, такие как проверка разъемов или подсоединения принтера к сети.
Раз в квартал он разряжает батареи системы бесперебойного электропитания (UPS), чтобы убедиться, что программное обеспечение UPS корректно отключает его серверы. Будет лучше, если обнаружится, что программное обеспечение UPS не работает, во время теста, чем во время сбоя электропитания. Если при неожиданном нарушении электропитания UPS сразу отключит напряжение, подаваемое на сервер Exchange (вместо постепенного отключения), то это с большой вероятностью приведет к повреждению базы данных.
Кроме того, он ежеквартально проверяет, не появились ли модификации и обновления аппаратно-программного обеспечения для всех его серверов, и в случае новых обновлений он выполняет их инсталляцию. Для пользователей он следит за модификациями и пакетами обновлений различных программ, которые используются в его фирме, и в случае их появления проводит тестирование совместно с небольшим количеством надежных пользователей; затем, исключив то, что дает отрицательные результаты, он распространяет модификации на всю сеть. И, наконец, он ежеквартально проверяет охлаждающие вентиляторы на всех серверах, чтобы убедиться, что они продолжают хорошо работать.
Хорошее планирование позволило ему заслужить доверие своих руководителей. Он не жалеет времени, чтобы объяснить, что он делает и почему. Поэтому со временем ему удалось реализовать много стандартов, обеспечивающих безотказную работу сети. Профилактические меры, включенные в планирование, позволяют ему в большинстве случаев предвидеть возможные изменения в его сети, а не заниматься устранением неполадок.