Оптимизация шаблонов Zabbix. Уменьшаем нагрузку на базу данных

По умолчанию, шаблоны Zabbix собирают очень много информации о сервисах Windows, с большой периодичностью – 1 раз в минуту, что на мой взгляд, очень часто.  Перед добавлением узлов сети, стоит разработать политику шаблонов. Лучше это сделать заранее, так в последствии с большой БД будет работать намного дольше.

После перехода на новую версию Zabbix, обнаружил резкий рост нагрузки на базу данных. При расследовании причины, выяснилось, очень большое количество элементов с малым интервалом опроса. Данные элементы создаются при использовании шаблона Template OS Windows Log Discovery, а конкретнее правилом авто обнаружения – Windows service discovery, в котором задан интервал опроса в 1 минуту.

Картина выглядит примерно так

Система начала немного притормаживать. Изменения количества обработчиков, количество удаляемых данных в конфигурационном файле zabbix_server.conf, положительного результата не принесли. Отключение функции autovacuum на сервере баз данных тоже не принесло ожидаемого снижения нагрузки. Произведена ревизия не поддерживаемых элементов, которые были отключены.  Тем не менее за неделю, размер БД увеличился на 150%

Элементов не очень много, но явное замедление было на лицо. Это и провали в графиках, т.е. отсутствие данных и ложные срабатывания

Вот для этого необходимо проработать политику опроса необходимых элементов. Так, например, наименее критичные сервера можно опрашивать раз в 15-30 минут и наоборот. Для этого необходимо:

Клонировать шаблон Zabbix

Должен получиться абсолютно идентичный шаблон, с полным набором правил обнаружения, триггеров, элементов и групп

Изменить в политике авто обнаружения интервал опроса, для добавляемых элементов

 

Стоит отметить, что элементы, созданные авто обнаружением можно добавлять как не активные и активировать их в случае необходимости. Все тоже самое касается и других шаблонов. Например для сбора информации о загрузке сетевого интерфейса на не критичных коммутаторах сети. Данные мероприятия позволят снизить нагрузку на базу данных и в тоже время получать информацию о всех узлах и серверах сети. После проделанных действий и очистки базы, очередь опроса исчезла.

Сейчас активно работает housekeeper, оно и понятно, сколько высвободилось места после отключения мониторинга не нужных сервисов и уменьшения интервала опроса

Внесение изменений в PostgreSQL

И добавим задание по сжатию в cron на запуск “vacuumdb” каждую пятницу день в 22:00

Информация от официалов

Просмотров: 336

Звёзд: 1Звёзд: 2Звёзд: 3Звёзд: 4Звёзд: 5 (1 оценок, среднее: 5,00 из 5)
Загрузка...

Оставить комментарий

Пожалуйста, авторизуйтесь чтобы добавить комментарий.
avatar
  Подписаться  
Уведомление о