Недавно я обновил наш кластер до Vmware Esxi 7.0 Update 3. Через пару дней случайно зависает виртуальная машина. На экране не отображается сообщение. В событиях vm я вижу следующие сообщения:
In(05) vcpu-0 - NVME-VMM: Controller level reset via CC.EN bit transition on nvme0
In(05) vcpu-0 - NVME-CORE: Doing a partial reset of controller regs and queues.
In(05) vcpu-1 - NVME-VMK: nvme0:0: Ignoring completions [ignoreCmp=0].
In(05) vcpu-8 - NVME-VMM: Unexpected CQ#8 doorbell write: prevHead=46, newHead=47, size=256, inflight=0
In(05) vcpu-0 - Vix: [vmxCommands.c:7182]: VMAutomation_HandleCLIHLTEvent. Do nothing.
In(05) vcpu-0 - MsgHint: msg.monitorevent.halt
In(05)+ vcpu-0 - The CPU has been disabled by the guest operating system. Power off or reset the virtual machine.
В виртуальной машине я не вижу сообщений об ошибках. Только это всплывает примерно в то время, когда машина блокируется.
kernel: [28667.084637] nvme nvme0: I/O 197 QID 14 timeout, aborting
kernel: [28667.084716] nvme nvme0: Abort status: 0x0
kernel: [28697.292556] nvme nvme0: I/O 197 QID 14 timeout, reset controller
kernel: [28697.356676] nvme nvme0: 15/0/0 default/read/poll queues
Виртуальная машина настроена с контроллером nvme, а виртуальный диск размещен на томе, сопоставленном с хранилищем nvme по nvme по оптоволоконному каналу.
После понижения версии Esxi до 7.0 Update 2d проблемы исчезли. Vmware говорит мне, что это может быть связано с ошибкой ядра.
В чем может быть проблема?