Мой zpool испытал два последовательных отказа диска. Когда я переворачивал первый, второй сбой, и я получил две ошибки, в моментальных снимках. Перепроцессинг закончился, и затем я использовал «zpool replace» для восстановления второго неисправного диска.
Пул смонтирован, все данные в безопасности и доступны, за исключением двух файлов:
pool: gggpool
state: DEGRADED
status: One or more devices has experienced an error resulting in data corruption.
Applications may be affected.
scan: resilvered 2,35T in 19h29m with 5 errors on Sat Sep 21 03:08:24 2013
config:
NAME STATE READ WRITE CKSUM
gggpool DEGRADED 0 0 5
raidz1-0 DEGRADED 0 0 10
scsi-SATA_ST3000DM001-9YN_Z1F0NJKS ONLINE 0 0 0
scsi-SATA_ST3000DM001-9YN_Z1F0RPKE ONLINE 0 0 0
scsi-SATA_ST3000DM001-9YN_Z1F0RPZG ONLINE 0 0 0
scsi-SATA_ST3000DM001-9YN_Z1F0RQJ2 ONLINE 0 0 0
scsi-SATA_ST3000DM001-9YN_Z1F0RQSV ONLINE 0 0 0
scsi-SATA_ST3000DM001-9YN_Z1F0T6VN ONLINE 0 0 0
spare-6 DEGRADED 0 0 0
scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404 UNAVAIL 0 0 0
scsi-SATA_ST3000DM001-9YN_Z1F118BA ONLINE 0 0 0
replacing-7 UNAVAIL 0 0 0
scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC UNAVAIL 0 0 0
scsi-SATA_ST3000DM001-1CH_Z1F2Z8SM ONLINE 0 0 0
spares
scsi-SATA_ST3000DM001-9YN_Z1F118BA INUSE currently in use
Оставшиеся ошибки, вероятно, указывают на то, где были неисправные файлы - я уничтожил соответствующие снимки, но эти сообщения об ошибках остаются :
errors: Permanent errors have been detected in the following files:
<0x218>:<0x7308>
<0x3a0>:<0x295a6b>
Я не беспокоюсь об этих ошибках. Я пытаюсь отсоединить два неисправных диска, оба из которых были заменены, но zpool не делает этого:
root@ggg:~# zpool detach gggpool scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC
cannot detach scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC: no valid replicas
root@ggg:~# zpool detach gggpool scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404
cannot detach scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404: no valid replicas
Два диска были физически удалены из массива - отправлены на гарантийную замену. - но они живут в конфигурации zpool. Как мне от них избавиться?
При чтении данных из пула я вижу, что «заменяющий-7» vdev не активен:
capacity operations bandwidth
pool alloc free read write read write
----------------------------------------------- ----- ----- ----- ----- ----- -----
gggpool 19,8T 1,96T 323 0 36,8M 0
raidz1 19,8T 1,96T 323 0 36,8M 0
scsi-SATA_ST3000DM001-9YN_Z1F0NJKS - - 177 0 5,42M 0
scsi-SATA_ST3000DM001-9YN_Z1F0RPKE - - 184 0 5,26M 0
scsi-SATA_ST3000DM001-9YN_Z1F0RPZG - - 183 0 5,55M 0
scsi-SATA_ST3000DM001-9YN_Z1F0RQJ2 - - 183 0 5,25M 0
scsi-SATA_ST3000DM001-9YN_Z1F0RQSV - - 180 0 5,39M 0
scsi-SATA_ST3000DM001-9YN_Z1F0T6VN - - 181 0 5,21M 0
spare - - 298 0 5,47M 0
scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404 - - 0 0 0 0
scsi-SATA_ST3000DM001-9YN_Z1F118BA - - 230 0 5,49M 0
replacing - - 0 0 0 0
scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC - - 0 0 0 0
scsi-SATA_ST3000DM001-1CH_Z1F2Z8SM - - 0 0 0 0
----------------------------------------------- ----- ----- ----- ----- ----- -----
Это беспокоит, потому что без этого VDEV работает, пул не имеет избыточности - но я не могу удалить или отсоединить ни один из двух его дисков. Я нахожусь в процессе создания полной резервной копии - только день, чтобы уйти. Тем не менее, уничтожение этого пула и его перестройка вызовет ОЧЕНЬ много головных болей, при этом многие файловые системы, а также общий доступ к файлам smb и afs должны быть переустановлены.
И идеи, как я могу заставить эту неудачную замену-7 vdev работать снова?
РЕШЕННЫЙ
Шаги:
Затем выпустите это:
zpool online gggpool [drive in 'spare' or 'rebuilding' that says online but is not really online]
- это запускает пересеребряный процесс на всем vdevs, который должен повторно посеребрить.
Ожидайте перепосеребрения для окончания; Vdevs затем все укажет "онлайн" в земельном участке "ухудшенных".
Наконец, отсоедините упрямые удаленные диски:
zpool detach gggpool [unavailable drive]
Все здоровые пулы.