Советы по обслуживанию корпоративного сервера

от 09.10.2024

Серверы мощное устройство во всех смыслах этого слова, они могут работать 24 часа в сутки семь дней в неделю без каких-либо проблем. Однако их эффективность может быть резко снижена, если они лишены должного обслуживания. Вы можете предотвратить выход сервера из строя или серьезные проблемы с качеством сервиса, просто регулярно проверяя его состояние.

Убедитесь, что резервные копии находятся в рабочем состоянии

Одна из лучших вещей, которые вы можете сделать, - это обеспечить резервное копирование данных. Существует несколько вариантов резервного копирования сервера. Вы можете использовать локальное резервное копирование (внутренние или внешние жесткие диски, магнитные ленты и т. д.) или удаленное (offsite). У каждого из этих вариантов есть свои плюсы и минусы, однако удаленное резервное копирование часто является более безопасным вариантом, поскольку его расположение в отдельном месте защищает от стихийных бедствий. Прежде чем вносить какие-либо изменения, убедитесь, что резервные копии работают. Проверьте, правильно ли выбрано место резервного копирования. Проведите несколько тестовых восстановлений, чтобы быть уверенным в его корректной работе.

Проверьте, как используются дисковые накопители

Если на дисках занято слишком много места, это может быстро сказаться на производительности и увеличить износ дисков типа SSD. Важно следить за использованием диска и принимать упреждающие меры для освобождения дискового пространства. Идеи экономии места включают удаление старых писем, журналов и неиспользуемых версий программного обеспечения. Если диск используется более чем на 90 %, приобретите дополнительное хранилище или сократите его использование. Стопроцентное использование сервера приведет к тому, что он перестанет отвечать на запросы, повредит таблицы данных, что приведет к дальнейшей потере данных.

Регулярное обновление ОС

Системы Linux часто выпускают обновления, и следить за ними может быть непросто. Поэтому очень важно использовать инструменты управления исправлениями, а также мониторинг, который предупредит вас об обновлении системы. Вы можете пропустить жизненно важные обновления безопасности, если решите обновлять систему вручную или вообще без них. Если автоматические обновления невозможны, то лучше всего создавать обновления по расписанию. Если вы не будете регулярно обновлять систему, вы можете стать жертвой хакеров, вредоносных программ и потерять важные данные.

Регулярно чистите свой сервер

Некоторые люди ошибаются, думая, что, поскольку их серверы находятся в закрытых шкафах, они не загрязняются. Тем не менее даже серверы, находящиеся в надлежащих условиях, могут затягивать в себя пыль и грязь. Через некоторое время это может негативно сказаться на их производительности и надежности.
Современные мощные процессоры и графические процессоры требуют правильно работающих вентиляторов для улучшения циркуляции воздуха. Если вентиляторы долгое время подвергаются воздействию пыли и грязи, они могут перестать работать должным образом.

Проверьте наличие ошибок в аппаратном обеспечении

Просмотрите журналы на предмет обнаружения проблем с оборудованием. Сбои в работе сети, ошибки чтения дисков и сообщения о перегреве могут быть ранними признаками возможного отказа оборудования.

Смените пароль

Это может показаться мелочью, но крайне важно менять пароль не реже двух раз в год, особенно если пароли были выданы ранее в целях технического обслуживания. Помните, что пароли должны быть длинными и сложными и по возможности содержать комбинации букв, цифр и специальных символов.

Проверяйте батареи ИБП

В последнее время ИБП претерпели огромные улучшения. Однако это не означает, что они не теряют свою емкость со временем. Проверяйте свои ИБП не реже одного раза в год, чтобы определить, как долго они смогут поддерживать работу сервера. Это поможет вам определить лучшее время для их замены, особенно если вы обнаружите, что время их работы резко сократилось.

Проверка безопасности систем

Используйте инструменты удаленного управления для проверки безопасности, аудита безопасности сервера, проверки обновлений ОС, конфигурации системы и других возможных рисков. В идеале это нужно делать ежемесячно, но если это невозможно, то хотя бы ежеквартально.

Мониторинг аварийных сигналов RAID

Во всех рабочих серверах должен использоваться RAID-массив, поэтому необходимо следить за его состоянием. Отказ одного диска может привести к полному отказу системы. Это может привести к тому, что простая замена диска обернется сценарием аварийного восстановления, на который потребуется несколько часов.

Мониторинг использования сервера

Используйте следующие программные продукты для мониторинга ваших серверов: Zabbix, Nagios, Ntop (Ntopng), Observium. 

Контролируйте загрузку сети, оперативной памяти, процессора и дисков. Если вы почти достигли предельного уровня, подумайте о привлечении дополнительных ресурсов или даже о переносе сервера на другой сервер.

Советы по обслуживанию корпоративного сервера