Я только что заменил материнскую плату на Dell PowerEdge R410, который функционирует как один из наших виртуальных серверов (работает под управлением Ubuntu 10.04.3 LTS). Я довольно новичок в Linux, и был очень удивлен, когда сеть была полностью нарушена после обмена. Еще один отказ от ответственности заключается в том, что я не создавал наши виртуальные серверы с самого начала, и у меня очень ограниченное понимание того, как работает Linux-KVM. После замены материнской платы я запустил приложение LifeCycle Controller и применил ряд обновлений (наиболее заметным из которых будет обновление прошивки для сетевых адаптеров). После долгих исследований мне наконец-то удалось «починить» сеть, отредактировав файл /etc/udev/70-persistent-net.rules. В этом файле я удалил 2 старые записи Broadcom (bnx2) для предыдущей материнской платы, а затем переименовал новые bnx2 eth2 и eth3 в eth0 и eth1 соответственно. Затем я переместил eth0 и eth1 в начало документа. Записи (igb) предназначены для гигабитного сетевого адаптера Intel на основе PCI, который в настоящее время не используется. Вот содержимое моего файла 70-persistent-net.rules:
# This file was automatically generated by the /lib/udev/write_net_rules
# program, run by the persistent-net-generator.rules rules file.
#
# You can modify it, as long as you keep each rule on a single
# line, and change only the value of the NAME= key.
# PCI device 0x14e4:0x163b (bnx2)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="78:2b:cb:20:9d:71", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"
# PCI device 0x14e4:0x163b (bnx2)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="78:2b:cb:20:9d:72", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth1"
# PCI device 0x8086:0x10c9 (igb)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="90:e2:ba:0c:7e:f9", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth2"
# PCI device 0x8086:0x10c9 (igb)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="90:e2:ba:0c:7e:f8", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth3"
Это решило, что сеть полностью разорвалась (не могла пинговать шлюз раньше), но гораздо более серьезная проблема осталась, где аппаратное обеспечение сервера случайно перезагружается. Я не могу легко воспроизвести сбой, но это влечет за собой запуск 5 гостевых ОС, которые работают на машине, а затем выполнение запросов Splunk / ping / запуск X11 для пересылки в puTTY и т. Д. Аппаратное обеспечение само проходит все самотестирования, и специалист Dell изучил DSET, который я собрал, и упомянул, что все выглядит великолепно с точки зрения аппаратного обеспечения.
Вот мой файл / etc / network / interfaces:
auto lo
iface lo inet loopback
auto eth0
iface eth0 inet manual
auto eth1
iface eth1 inet manual
# 10.1.225.x network
auto br0
iface br0 inet static
address 10.1.225.12
netmask 255.255.255.0
network 10.1.225.0
broadcast 10.1.225.255
gateway 10.1.225.1
bridge_ports eth0
bridge_fd 9
bridge_hello 2
bridge_maxage 12
bridge_stp off
#vlan 231
auto eth1.231
iface eth1.231 inet manual
up ifconfig eth1.231 up
#KVM bridge, vlan 231, via eth1
iface br231 inet static
bridge_ports eth1.231
bridge_fd 9
bridge_hello 2
bridge_maxage 12
bridge_stp off
##vlan 229
#auto eth1.229
#iface eth1.229 inet manual
# up ifconfig eth1.229 up
##KVM bridge, vlan 229, via eth1
#auto br229
#iface br229 inet manual
# bridge_ports eth1.229
# bridge_maxwait 5
# bridge_fd 1
# bridge_stp on
#
# !!!!! NOTE (MGRACE): This *is* used !!!!!
#
#No! Unused
auto br1
iface br1 inet manual
bridge_ports eth1
bridge_fd 9
bridge_hello 2
bridge_maxage 12
bridge_stp off
#auto br2
#iface br2 inet manual
# bridge_ports eth1
# bridge_fd 9
# bridge_hello 2
# bridge_maxage 12
# bridge_stp off
#auto br3
#iface br3 inet manual
# bridge_ports eth1
# bridge_fd 9
# bridge_hello 2
# bridge_maxage 12
# bridge_stp off
Я отсканировал все журналы, которые я могу достать, и еще не нашел крошки, чтобы следовать = (. Dell Технический специалист отметил, что это может быть так же просто, как изменить MAC-адрес гипервизора, но я не мог понять, как это сделать до этого момента. Любая помощь очень ценится, и я был бы рад предоставить любую дополнительную информацию это может оказаться полезным.
Спасибо, -Snipe
Хорошая новость: оказывается, что неисправный блок распределения питания на сервере вызывал случайные перезагрузки. Я бы не смог понять это, если бы проблема не экспоненциально обострилась 2 понедельника назад, что позволило нам и специалисту Dell наконец отследить источник. Извините за ошибочный диагноз всем! =)
-Snipe