«Ты никогда не будешь знать достаточно, если не будешь знать больше, чем достаточно».
Уильям Блейк
Давайте зададимся каверзным вопросом: насколько для дорогой, надёжной серверной платформы необходим комплексный программно-аппаратный мониторинг? Ведь современные серверы собираются из очень качественных компонентов с повышенной наработкой на отказ, и каждая комплектующая, от чипа на материнской плате до подшипника корпусного вентилятора, рассчитана на многолетний срок службы. Для чего нужен мониторинг, если всё работает как надо и от вашего вмешательства ничего не изменится?
Нужен ли мониторинг сервера и для чего?
Вспомните свой первый домашний компьютер. Помните, как поначалу устанавливали утилиты, которые показывали температуру процессора, скорость вращения вентиляторов, состояния жёстких дисков? А через неделю, наигравшись информацией, выдающей абсолютную норму работы системы, сносили «бесполезный» софт. Чтобы вернуться к нему тогда, когда проблему с «железом» или операционной системой могло решить только срочное оперативное вмешательство и временны́е и финансовые потери становились суровой реальностью.
К большому сожалению, такая ситуация часто создаёт негативный паттерн отношения к данному вопросу. Как сказал в своё время попечитель богоугодных заведений Земляника из «Ревизора»:
“Человек простой: если умрёт, то он и так умрёт, если выздоровеет, то он и так выздоровеет”.
И с сервером, вроде бы, получается похожая ситуация… Если срок службы компонента выработан, и он готов выйти из строя, то, как может остановить этот процесс мониторинг?
Данный подход в корне неверен: пренебрежение информацией и оперативным реагированием на неё может дорого обойтись нерадивому пользователю.
В этой связи вспоминается поучительный случай из нашей практики. Как-то, при плановой проверке вроде бы абсолютно «здорового» жёсткого диска по атрибутам SMART, обнаружилось тревожное состояние двух показателей, отвечающих за скоротечный прогноз по нестабильным секторам (кому интересно, один из них – атрибут 197, он же С5, в разном представлении утилит мониторинга). После некоторых манипуляций с дополнительными проверками данные с диска были скопированы на новый носитель, а сам диск отправлен на «пенсию» для записи всяческого инфомусора, который не жалко потерять.
Спустя полтора месяца работы в таком режиме в какой-то момент логический раздел HDD перестал определяться системой. SMART показал около 2000 перемещённых секторов - диск, что называется, «посыпался», данные с него извлечь не удалось. Если бы он не был вовремя протестирован утилитой мониторинга и заменён на новый, рабочая информация была бы утеряна безвозвратно, либо восстановление обошлось бы слишком дорого.
Другой похожий пример – выход из строя диска в составе RAID. При вовремя обнаруженном отказе 1-2 носителей в составе массива замена на новый пройдёт для системы практически незаметно. В отсутствии регулярных проверок из RAID может выпасть больше дисков, чем предусматривает предел надёжности массива и тогда не миновать потери данных, часто за большой период времени. Таким образом, плановая проверка нужна даже для отказоустойчивых систем и технологий.
Технический мониторинг нужен для того, чтобы решить задачу выявления потенциальных проблем с некоторым упреждением, не допустив аппаратного сбоя, остановки работы системы и потери данных на том этапе, когда устранение всего этого станет материально затратным и трудоёмким. Даже если мы понимаем, что вероятность наступления проблемы не равна ста процентам, то риск иногда обходится слишком дорого.
Если отслеживать состояние компонентов системы необходимо, то с помощью каких средств это лучше делать и есть ли своя специфика применительно к серверам и рабочим станциям для видеонаблюдения? Существует множество различных решений, специальных приложений и даже технологий, которые обеспечивают этот процесс.
Для чего нужен мониторинг серверного оборудования в системах видеонаблюдения и какие инструменты мониторинга доступны подробно разбирается в докладе Александра Юнисова - руководителя компании Видеомакс на конференции для проектировщиков IP-видеонаблюдения PROIPvideo2018:
Бесплатные утилиты контроля серверов
Существует множество бесплатных утилит, которые призваны выводить данные о состоянии аппаратных ресурсов. Помимо отсутствия платы за лицензию, преимуществом этих решений является простота использования. Часто эти приложения даже не нужно устанавливать в систему, они могут быть запущены с обычной флешки. Казалось бы, что ещё нужно? Скачал такую утилиту, запустил exe-файл и «мониторь» в своё удовольствие! Однако, здесь пользователя может подстерегать несколько подводных камней, а то и целый «риф».
Прежде всего, нередко такие решения ограничены по своему функционалу, отслеживают не все параметры системы или не вполне точно дают значения этих параметров. Происходит это в силу того, что такой софт не всегда корректно работает с драйверами и датчиками конкретной материнской платы и других устройств.
Другое неудобство следует из сказанного выше: в случае, когда утилита предоставляет не все данные о системе, либо эти данные по каким-то причинам некорректны, приходится использовать два, а то и три разных приложения для покрытия всех аппаратных сегментов системы. Например, многие утилиты, предоставляющие информацию по параметрам SMART, «не видят» дисковых массивов и состояния отдельного диска в них. Даже если такие утилиты и качественны сами по себе как продукт, они являются недостаточным решением в рамках комплексного мониторинга аппаратных ресурсов, а ведь именно комплексный мониторинг – залог здоровья и надёжной работы сервера или рабочей станции.
«Бесплатный» статус подразумевает то, что программа поставляется в классическом варианте «как есть», и предъявлять претензии к качеству его работы бессмысленно.
Диагностические комплексы
О’кей, но ведь существуют ещё специализированные платные (иногда дорогостоящие!) программные комплексы для мониторинга аппаратной части, предусматривающие практически все необходимые и возможные аспекты контроля состояния системы. Уж они-то наверняка смогут решить запросы самых капризных пользователей! Давайте не будем спешить с выводами и рассмотрим этот вопрос чуть подробнее.
Бесспорно, комплексное решение, позволяющее представить все параметры в едином интерфейсе – вещь замечательная. Но её достоинства оборачиваются сложностями относительно применения именно в системах видеонаблюдения. И высокая стоимость лицензии за такой софт является далеко не самым большим его недостатком.
Представление информации в мощных комплексах мониторинга рассчитано на квалифицированного, продвинутого пользователя, а то и системного администратора. Может и хорошо, когда «сисадмин» денно и нощно находится на объекте, но на практике большую часть времени в системе видеонаблюдения проводит именно оператор на посту охраны и, скорее всего, ему первому придётся столкнуться с нештатной ситуацией в плане отказа техники. Следовательно, именно ему должна быть предназначена информация, выдаваемая любым софтом для мониторинга. Но чаще всего как раз оператор в меньшей степени является специалистом в области работы железа и операционной системы. Это, на наш взгляд, один из ключевых моментов, отличающих мониторинг аппаратной части в системах видеонаблюдения от классических решений для IT-инфраструктуры.
Обратить внимание
Кроме сказанного выше, необходимо учитывать, что сервер для видеонаблюдения – интегральное решение, включающее программное обеспечение, и регулярный мониторинг состояния системы, необходимый для долгого её функционирования, должен состоять не только в наблюдении за аппаратными ресурсами, но и в контроле работы приложений, операционной системы, самого ПО для видеонаблюдения.
В этой связи не стоит забывать, что ПО для видеонаблюдения часто само по себе предоставляет средства мониторинга системы и самодиагностики, включённые в его функционал. Может, это выход?
Мониторинг сервера средствами ПО для видеонаблюдения
Что могут предложить нам производители программного обеспечения для того, чтобы мы могли отслеживать состояние работы системы средствами ПО?
Большинство приложений для видеонаблюдения имеют в своём составе те или иные способы мониторинга системы. Другое дело, какие именно это средства и что они позволяют отслеживать.
Чаще всего это инструменты программной самодиагностики, проверки корректности работы элементов самого приложения, что, конечно тоже очень важно, но недостаточно для полной картины.
Для краткости мы собрали информацию воедино. Ниже приведена таблица, показывающая возможности мониторинга основных состояний системы, которые имеют некоторые из представленных на нашем рынке приложений для видеонаблюдения.
Объекты мониторинга |
Программное обеспечение |
||||||
---|---|---|---|---|---|---|---|
Интеллект |
Axxon |
Макроскоп |
Milestone1 |
Axis |
Трассир |
Линия |
|
Доступность сервера |
+ |
+ |
+ |
+ |
- |
+ |
+ |
CPU, °C |
- |
- |
- |
- |
- |
- |
- |
MB, °C2 |
-3 |
- |
- |
- |
- |
- |
- |
Загрузка CPU |
+ |
+ |
+ |
+ |
- |
+ |
- |
Загрузка GPU | - | - | - | + | - | +4 | - |
Память5 |
+ |
- |
+ |
+ |
- |
- |
- |
HDD6 |
- |
- |
- |
- |
- |
+ |
- |
Архив7 |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
RAID8 |
- |
- |
- |
- |
- |
- |
- |
Система охлаждения9 |
- |
- |
- |
- |
- |
- |
- |
Загрузка сети |
+ |
+ |
+ |
+ |
+ |
- |
- |
1 Только в версиях Expert и Corporate
2 Температура элементов материнской платы
3 Доступна работа с отдельно подключаемыми цифровыми термодатчиками третьих производителей
4 Отсутствует в пользовательском интерфейсе, но доступно через скрипты
5 Объём, использование, утилизация
6 Состояние дисков по SMART
7 Состояние архивного тома: ведётся запись или нет
8 Состояние дискового массива
9 Работа вентиляторов системы охлаждения
Продвинутые пользователи скажут: "Довольно скромный список параметров... А где же состояние видеокарты, блока питания, статистика потерянных пакетов, ошибки памяти и т.п.?"
Верно! Но даже при столь кратком перечне самых важных параметров платформы сервера мы видим, что в таблице нет ни одного ПО, где были бы представлены все приведённые позиции контроля системы.
Ситуация осложняется и тем, что для отдельных приложений модули мониторинга являются платным дополнением. Но это ещё полбеды. Практически ни одно из представленных ПО не имеет таких важных инструментов диагностики, как состояние HDD-носителей по атрибутам SMART, статус дискового массива, а также простейших, но ценных характеристик – температуры центрального процессора и чипов материнской платы. Таким образом, мы, фактически, не имеем возможности полноценно контролировать состояние системы таким, казалось бы, удобным способом, как мониторинг средствами самого ПО для видеонаблюдения.
Варианты решения
Что же в итоге? Приходиться принять тот факт, что такая давняя и многократно освещённая тема, как отслеживание и предотвращение неисправностей аппаратных ресурсов компьютерной техники, имеет свою исключительную и ярко выраженную специфику в сфере PC-based решений для систем видеонаблюдения.
Тот способ получения информации о состоянии серверов и рабочих станций, который широко применяется в IT-сфере, т.е., активный опрос системным администратором параметров устройств с пониманием специфики полученных данных не эффективен в нашем случае из-за недостаточной квалификации операторского персонала. По сути, необходимо не только автоматическое отслеживание значений критических параметров системы и вывод их на монитор, но и представление данных в понятной для оператора форме. А самое главное - оператору нужно тревожное окно, которое автоматически откроется поверх всех интерфейсов и оповестит его о проблеме.
Программное обеспечение для мониторинга состояния системы в видеонаблюдении должно совмещать простоту дружественного интерфейса, понятного оператору на посту охраны и функциональность приложения для системного администрирования. Готового решения не существует!
На текущий момент ни один из способов контроля состояния серверного оборудования не соответствует потребностям и задачам системы видеонаблюдения.
Устраняем пробелы
Понимая всю сложность и, одновременно, актуальность задачи, компания Видеомакс решилась на радикальный шаг: мы взялись за разработку своего собственного приложения для комплексного мониторинга серверов и рабочих станций. Приложение получило название Диспетчер VIDEOMAX.
Диспетчер VIDEOMAX
Диспетчер VIDEOMAX - приложение специально разработанное для контроля серверов и рабочих станций системы видеонаблюдения. Приложение состоит из двух частей - Агент VIDEOMAX и Монитор VIDEOMAX. Агент VIDEOMAX осуществляет контроль параметров платформы, протоколирование изменения состояния и тревоги, передает состояние и тревожные события в Монитор VIDEOMAX. Монитор VIDEOMAX обеспечивает контроль оператором видеонаблюдения состояния системы в простом и наглядном виде, а также выдачу тревожных окон для привлечения внимания оператора к аппаратным сбоям, требующим оперативного устранения.
Диспетчер VIDEOMAX совмещает в себе полный контроль всех параметров компьютерной платформы, включая использование ресурсов (загрузка процессора, памяти, сетевых интерфейсов), а так же простоту интерфейсов оператора и уведомления в виде тревожных окон. Благодаря Диспетчеру VIDEOMAX отпадает необходимость в периодической проверке работы компьютерного оборудования системы видеонаблюдения. Подробнее о Диспетчере VIDEOMAX
Если же на объекте эксплуатируется иное компьютерное оборудование, полезными будут общие рекомендации:
-
Регулярно проверяйте состояние серверов встроенными диагностическими утилитами. Делайте это не реже, чем раз в три месяца.
-
Если сервер имеет выход в Интернет, оперативно уведомить о неисправности заинтересованных лиц поможет специализированное ПО диагностики. Для серверов с IPMI существуют простые приложения удаленного контроля в рамках ЛВС.
-
Настройте мониторинг состояния сервера в ПО видеонаблюдения, которое эксплуатируется на вашем видеосервере.
В комплекте с изделиями VIDEOMAX поставляется набор бесплатных утилит, которые позволят обнаружить типовые проблемы в платформе. Напоминаем, что в изделиях серии PRO всегда присутствует поддержка IPMI. Помочь настроить систему контроля серверов в ПО видеонаблюдения могут специалисты технической поддержки компании Видеомакс по телефону 8 800 302-55-46.