Серверы мощное устройство во всех смыслах этого слова, они могут работать 24 часа в сутки семь дней в неделю без каких-либо проблем. Однако их эффективность может быть резко снижена, если они лишены должного обслуживания. Вы можете предотвратить выход сервера из строя или серьезные проблемы с качеством сервиса, просто регулярно проверяя его состояние.
Одна из лучших вещей, которые вы можете сделать, - это обеспечить резервное копирование данных. Существует несколько вариантов резервного копирования сервера. Вы можете использовать локальное резервное копирование (внутренние или внешние жесткие диски, магнитные ленты и т. д.) или удаленное (offsite). У каждого из этих вариантов есть свои плюсы и минусы, однако удаленное резервное копирование часто является более безопасным вариантом, поскольку его расположение в отдельном месте защищает от стихийных бедствий. Прежде чем вносить какие-либо изменения, убедитесь, что резервные копии работают. Проверьте, правильно ли выбрано место резервного копирования. Проведите несколько тестовых восстановлений, чтобы быть уверенным в его корректной работе.
Если на дисках занято слишком много места, это может быстро сказаться на производительности и увеличить износ дисков типа SSD. Важно следить за использованием диска и принимать упреждающие меры для освобождения дискового пространства. Идеи экономии места включают удаление старых писем, журналов и неиспользуемых версий программного обеспечения. Если диск используется более чем на 90 %, приобретите дополнительное хранилище или сократите его использование. Стопроцентное использование сервера приведет к тому, что он перестанет отвечать на запросы, повредит таблицы данных, что приведет к дальнейшей потере данных.
Системы Linux часто выпускают обновления, и следить за ними может быть непросто. Поэтому очень важно использовать инструменты управления исправлениями, а также мониторинг, который предупредит вас об обновлении системы. Вы можете пропустить жизненно важные обновления безопасности, если решите обновлять систему вручную или вообще без них. Если автоматические обновления невозможны, то лучше всего создавать обновления по расписанию. Если вы не будете регулярно обновлять систему, вы можете стать жертвой хакеров, вредоносных программ и потерять важные данные.
Некоторые люди ошибаются, думая, что, поскольку их серверы находятся в закрытых шкафах, они не загрязняются. Тем не менее даже серверы, находящиеся в надлежащих условиях, могут затягивать в себя пыль и грязь. Через некоторое время это может негативно сказаться на их производительности и надежности.
Современные мощные процессоры и графические процессоры требуют правильно работающих вентиляторов для улучшения циркуляции воздуха. Если вентиляторы долгое время подвергаются воздействию пыли и грязи, они могут перестать работать должным образом.
Просмотрите журналы на предмет обнаружения проблем с оборудованием. Сбои в работе сети, ошибки чтения дисков и сообщения о перегреве могут быть ранними признаками возможного отказа оборудования.
Это может показаться мелочью, но крайне важно менять пароль не реже двух раз в год, особенно если пароли были выданы ранее в целях технического обслуживания. Помните, что пароли должны быть длинными и сложными и по возможности содержать комбинации букв, цифр и специальных символов.
В последнее время ИБП претерпели огромные улучшения. Однако это не означает, что они не теряют свою емкость со временем. Проверяйте свои ИБП не реже одного раза в год, чтобы определить, как долго они смогут поддерживать работу сервера. Это поможет вам определить лучшее время для их замены, особенно если вы обнаружите, что время их работы резко сократилось.
Используйте инструменты удаленного управления для проверки безопасности, аудита безопасности сервера, проверки обновлений ОС, конфигурации системы и других возможных рисков. В идеале это нужно делать ежемесячно, но если это невозможно, то хотя бы ежеквартально.
Во всех рабочих серверах должен использоваться RAID-массив, поэтому необходимо следить за его состоянием. Отказ одного диска может привести к полному отказу системы. Это может привести к тому, что простая замена диска обернется сценарием аварийного восстановления, на который потребуется несколько часов.
Используйте следующие программные продукты для мониторинга ваших серверов: Zabbix, Nagios, Ntop (Ntopng), Observium.
Контролируйте загрузку сети, оперативной памяти, процессора и дисков. Если вы почти достигли предельного уровня, подумайте о привлечении дополнительных ресурсов или даже о переносе сервера на другой сервер.