Home »

Создание и настройк...
 

[Решено] Создание и настройка кластера «VMware Fault Tolerance»


STALKER_SLX
Сообщения: 200
Topic starter
(@stalker_slx)
Devops
Присоединился: 2 года назад

Доброго времени суток уважаемые форумчане!

Имеется:

  1. VMware vSphere 6.7.
  2. Два идентичных сервера «HP ProLiant DL360p Gen8»:

- Intel(R) Xeon(R) CPU E5-2690 v2 @ 3.00GHz;

- RAM – 64 Gb;

- RAID10 – 4xSSD 400Gb.

 

Нужно на базе вышеуказанного хозяйства настроить кластер «Fault Tolerance», очень-очень прошу у Вас помощи разобраться в этом «тёмном» для меня вопросе!

Ответить
3 Ответов
STALKER_SLX
Сообщения: 200
Topic starter
(@stalker_slx)
Devops
Присоединился: 2 года назад

Немного дополню исходные данные.

3.Руководство уже предоставило несколько максимальных лицензий - VMware vSphere 6 Enterprise Plus (CPUs) и VMware vSAN Standard (CPUs) - количество процессоров неограничено (см. картинку во вложении).

Теперь меня поставили перед фактом, что нужно настроить кластер именно на «Fault Tolerance»! Но у меня пока не хватает знаний для этого...

4. Кроме того, забыл упомянуть, что серверы находятся на физически разных площадках, но компания приобрела транспортную сетку (L2), то есть ВСЕ серверы компании по сути находятся в "локальной сети".

Ответить
STALKER_SLX
Сообщения: 200
Topic starter
(@stalker_slx)
Devops
Присоединился: 2 года назад

Также после создания нового кластера и добавления в него обеих ESXi-серверов, столкнулся с ошибкой: "HA agent is unreachable".
То есть на одном из ESXi-хостов пишет что-то типа "HA agent master successfully running", а на втором - вместо "slave successfully running", вываливается указанная ошибка.
Но при этом мной также был замечен следующий нюанс: если я перевожу ESXi-хост с работающим "HA agent master" в "maintenance mode", то второй ESXi-хост сразу запускает свой "HA agent" в  "master successfully running" и светиться от счастья! 

После выведения из "maintenance mode" ситуация повторяется! То есть, если я вывожу из "maintenance mode" первым ESXi1, то его "HA agent" сразу становиться мастером и успешно запускается, а на ESXi2 - вылазит ошибка "HA agent is unreachable"
Если же первым вывожу из "maintenance mode" ESXi2, то его "HA agent" сразу становиться мастером и успешно запускается, а на ESXi1 - вылазит ошибка "HA agent is unreachable"

Ответить
STALKER_SLX
Сообщения: 200
Topic starter
(@stalker_slx)
Devops
Присоединился: 2 года назад

Забыл упомянуть ещё одну важную деталь - скорость сети между площадками была всего лишь 100 Мб/с (те, кто принимал такое решение явно не читали требований VMware к сети). После долгих мучений руководство таки приняло решение переместить один сервер (ноду) к другому, то есть они (сервера) сейчас воткнуты в один Гигабитный свич. После такого переезда указанная мной выше ошибка ИСЧЕЗЛА!

Но осталась еще одна - Proactive HA, которая гласит: «No response because no Proactive HA provider is enabled on the cluster.»

Начал я изучать еще более внимательно официальную документацию от VMware и увидел вот тут:
https://docs.vmware.com/en/VMware-vSphere/6.7/com.vmware.vsphere.avail.doc/GUID-57929CF0-DA9B-407A-BF2E-E7B72708D825.html

одну важную строчку: «Use a 10-Gbit logging network for FT and verify that the network is low latency. A dedicated FT network is highly recommended.»

Вопрос решен - нужно внедрять сеть со скорость больше 10ГигаБит!

Ответить