Добрый день.
Постараюсь быть краток.
Устанавливаю на машину последний CentOS 7.5.1804 x86_64, на машине имеется 25-гиговая сетевая карточка AOC-S25G-M2S Dual 25Gbe SFP28 Mellanox CX4 Lx EN
Система саму карточку видит, и pci_id=10003:01:00.0. В то время как на Debian pci_id=86:00.0
>[root@localhost ~]# lspci | grep Mellanox
>10003:01:00.0 Ethernet controller: Mellanox Technologies MT27710 Family [ConnectX-4 Lx]
>10003:01:00.1 Ethernet controller: Mellanox Technologies MT27710 Family [ConnectX-4 Lx]
>[root@localhost ~]# dmesg | grep mlx
>[ 6.463792] mlx5_core 10003:01:00.0: PCI INT A: no GSI
>[ 6.463813] mlx5_core 10003:01:00.0: Missing registers BAR, aborting
>[ 6.463915] mlx5_core 10003:01:00.0: error requesting BARs, aborting
>[ 6.464049] mlx5_core 10003:01:00.0: mlx5_pci_init failed with error code -19
>[ 6.464262] mlx5_core 10003:01:00.1: PCI INT B: no GSI
>[ 6.464280] mlx5_core 10003:01:00.1: Missing registers BAR, aborting
>[ 6.464378] mlx5_core 10003:01:00.1: error requesting BARs, aborting
>[ 6.464516] mlx5_core 10003:01:00.1: mlx5_pci_init failed with error code -19
>[ 1473.649409] mlx5_core 10003:01:00.0: PCI INT A: no GSI
>[ 1473.649428] mlx5_core 10003:01:00.0: Missing registers BAR, aborting
>[ 1473.650396] mlx5_core 10003:01:00.0: error requesting BARs, aborting
>[ 1473.651363] mlx5_core 10003:01:00.0: mlx5_pci_init failed with error code -19
>[ 1473.652359] mlx5_core 10003:01:00.1: PCI INT B: no GSI
>[ 1473.652377] mlx5_core 10003:01:00.1: Missing registers BAR, aborting
>[ 1473.653207] mlx5_core 10003:01:00.1: error requesting BARs, aborting
>[ 1473.654047] mlx5_core 10003:01:00.1: mlx5_pci_init failed with error code -19
НО при обращении на сетевые модуля как видно получаю ошибку.
Есть мнение что дело может быть в id pci-устройства, тулзы мелланокса не могут к карте подключиться из-за
длинной id, не могут ее перепрошить и заставить работать.
Отключил виртуализацию в биосе, не помогло.
Отписались о проблеме в Мелланокс. Мелланокс пока посылает в баню с формулировкой, что длинный id pci-домена - это не стандарт, поэтому тулзы их не поддерживают.
А самое странное что в RadHAT всё работает.... [b]с бубном[/b], но работает.
У кого нить есть хоть какие нибудь идеи?
Это удивительно, что в RHEL работает. Я всюду вижу информацию, что Centos по функционалу это полная копия RHEL, код один и тот же. Выходит, что это не так?
Англоязычный гугл проверяли? С этого стоит начать.
В гугле ошибка ищется. Увидел несколько ссылок прям по такой же проблеме. Посмотрите, если еще не проверяли.
Я вот такой запрос проверил:
"Mellanox Missing registers BAR, aborting"