Регулярно тормозят ...
 

Регулярно тормозят гостевые машины

4 Записи
2 Пользователи
0 Reactions
831 Просмотры
Записи: 2
Создатель темы
(@renikrenik)
New Member
Присоединился: 2 года назад

Доброго дня!

Каждый день, в промежутке с  12:30-13:00 начинают тормозить гостевые машины. Сайты почти не открываются, сложно работать с документам, платёжку в банке можно заполнять 5 минут вместо 30 секунд. И так в среднем 2-3 часа, в районе 15-00 опускает.

Что пробовал:

оценить нагрузку на процессор через htop и top, особо аномалий не заметил, хоть и опыта не много;

посмотрел свободную память, еще около 10-20 Гб свободно в такие моменты;

проверил скорость диска с гостевой, около 1000 Мб/с в обе стороны;

посмотрел температуры диска и процессора, никаких аномалий;

проверил загрузку сетевого канала, так не понимается выше 10 Мбит/с;

проверил загрузку канала у пользователей гостевых машин, стабильные 15-20 Мбит/с;

проверил время на гостевых и расписание бэкапов.

 

Подскажите, пожалуйста, как можно еще диагностировать такие тормоза?

Ответить
3 Ответов
3 Ответов
Admin
(@zerox)
Присоединился: 11 лет назад

Prominent Member
Записи: 926

@renikrenik по своему опыту могу сказать, что подобные проблемы чаще всего с нагрузкой на дисковую подсистему. По CPU и Памяти обычно по графикам всё видно, можно оценить беглым взглядом. А вот с дисками всё не так просто. Заочно мне, конечно же, что-то конкретное посоветовать невозможно. Но раз проблема плавающая, значит имеет явную причину и решение. По хорошему, нужен полноценный мониторинг гипервизора и гостевых систем. Без мониторинга решать такие проблемы трудно, так как зачастую надо сопоставить несколько графиков или метрик в одно и то же время для выявления проблемы. Когда нет такой возможности, вручную бегать по системам и урывками что-то смотреть в консоли можно долго.

Ответить
(@renikrenik)
Присоединился: 2 года назад

New Member
Записи: 2

@zerox на офф. форуме предложили сделать вывод команды в момент нагрузки аномалии:

head /proc/pressure/*
==> /proc/pressure/cpu <==
some avg10=10.56 avg60=26.88 avg300=13.88 total=3348138018

Подобный вывод означает, что за последние 60 секунд 27% процессов ожидали процессорного времени, что указывает на слишком высокую нагрузку на ЦП.

Предположу, что ядра процессора у меня распределены неверно, но я не могу найти внятную инструкцию как их правильно распределять. Всё сводится к тому, что гипервизор сам поймёт, кому давать ресурсы. Так и живу. 

У вас очень классные статьи на сайте, но всё же спрошу, какой посоветуете мониторинг, чтобы решить эту задачу?

Ответить
Admin
(@zerox)
Присоединился: 11 лет назад

Prominent Member
Записи: 926

@renikrenik мне трудно советовать, так как сам я везде и всегда использую Zabbix. Но он может быть сложен в освоении, если нужен эпизодически для разовых задач. В общем случае самые популярные и функциональные мониторинги на сегодня - Zabbix и Prometheus. А вообще у меня есть статья про современные системы мониторинга -  https://serveradmin.ru/top-20-besplatnyh-sistem-monitoringa/

Ответить
Используешь Telegram? Подпишись на канал автора →
This is default text for notification bar