zpool «заменить» vdev после переноса не удалось - не может отсоединиться

Мой zpool испытал два последовательных отказа диска. Когда я переворачивал первый, второй сбой, и я получил две ошибки, в моментальных снимках. Перепроцессинг закончился, и затем я использовал «zpool replace» для восстановления второго неисправного диска.

Пул смонтирован, все данные в безопасности и доступны, за исключением двух файлов:

pool: gggpool
state: DEGRADED
status: One or more devices has experienced an error resulting in data corruption.
        Applications may be affected.
scan: resilvered 2,35T in 19h29m with 5 errors on Sat Sep 21 03:08:24 2013 

config:

NAME                                             STATE     READ WRITE CKSUM
gggpool                                          DEGRADED     0     0     5
  raidz1-0                                       DEGRADED     0     0    10
    scsi-SATA_ST3000DM001-9YN_Z1F0NJKS           ONLINE       0     0     0
    scsi-SATA_ST3000DM001-9YN_Z1F0RPKE           ONLINE       0     0     0
    scsi-SATA_ST3000DM001-9YN_Z1F0RPZG           ONLINE       0     0     0
    scsi-SATA_ST3000DM001-9YN_Z1F0RQJ2           ONLINE       0     0     0
    scsi-SATA_ST3000DM001-9YN_Z1F0RQSV           ONLINE       0     0     0
    scsi-SATA_ST3000DM001-9YN_Z1F0T6VN           ONLINE       0     0     0
    spare-6                                      DEGRADED     0     0     0
      scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404  UNAVAIL      0     0     0
      scsi-SATA_ST3000DM001-9YN_Z1F118BA         ONLINE       0     0     0
    replacing-7                                  UNAVAIL      0     0     0
      scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC         UNAVAIL      0     0     0
      scsi-SATA_ST3000DM001-1CH_Z1F2Z8SM         ONLINE       0     0     0
spares
  scsi-SATA_ST3000DM001-9YN_Z1F118BA             INUSE     currently in use

Оставшиеся ошибки, вероятно, указывают на то, где были неисправные файлы - я уничтожил соответствующие снимки, но эти сообщения об ошибках остаются :

errors: Permanent errors have been detected in the following files:

    <0x218>:<0x7308>
    <0x3a0>:<0x295a6b>

Я не беспокоюсь об этих ошибках. Я пытаюсь отсоединить два неисправных диска, оба из которых были заменены, но zpool не делает этого:

root@ggg:~# zpool detach gggpool scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC
cannot detach scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC: no valid replicas

root@ggg:~# zpool detach gggpool scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404
cannot detach scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404: no valid replicas

Два диска были физически удалены из массива - отправлены на гарантийную замену. - но они живут в конфигурации zpool. Как мне от них избавиться?

При чтении данных из пула я вижу, что «заменяющий-7» vdev не активен:

                                                    capacity     operations    bandwidth
pool                                             alloc   free   read  write   read  write
-----------------------------------------------  -----  -----  -----  -----  -----  -----
gggpool                                          19,8T  1,96T    323      0  36,8M      0
  raidz1                                         19,8T  1,96T    323      0  36,8M      0
    scsi-SATA_ST3000DM001-9YN_Z1F0NJKS               -      -    177      0  5,42M      0
    scsi-SATA_ST3000DM001-9YN_Z1F0RPKE               -      -    184      0  5,26M      0
    scsi-SATA_ST3000DM001-9YN_Z1F0RPZG               -      -    183      0  5,55M      0
    scsi-SATA_ST3000DM001-9YN_Z1F0RQJ2               -      -    183      0  5,25M      0
    scsi-SATA_ST3000DM001-9YN_Z1F0RQSV               -      -    180      0  5,39M      0
    scsi-SATA_ST3000DM001-9YN_Z1F0T6VN               -      -    181      0  5,21M      0
    spare                                            -      -    298      0  5,47M      0
      scsi-SATA_WDC_WD30EZRX-00_WD-WMC1T4095404      -      -      0      0      0      0
      scsi-SATA_ST3000DM001-9YN_Z1F118BA             -      -    230      0  5,49M      0    
    replacing                                        -      -      0      0      0      0
      scsi-SATA_ST3000DM001-1CH_Z1F2Z9VC             -      -      0      0      0      0
      scsi-SATA_ST3000DM001-1CH_Z1F2Z8SM             -      -      0      0      0      0
-----------------------------------------------  -----  -----  -----  -----  -----  -----

Это беспокоит, потому что без этого VDEV работает, пул не имеет избыточности - но я не могу удалить или отсоединить ни один из двух его дисков. Я нахожусь в процессе создания полной резервной копии - только день, чтобы уйти. Тем не менее, уничтожение этого пула и его перестройка вызовет ОЧЕНЬ много головных болей, при этом многие файловые системы, а также общий доступ к файлам smb и afs должны быть переустановлены.

И идеи, как я могу заставить эту неудачную замену-7 vdev работать снова?

1
задан 22 September 2013 в 08:58

1 ответ

РЕШЕННЫЙ

Шаги:

  • уничтожьте все снимки, содержащие ошибки

Затем выпустите это:

zpool online gggpool [drive in 'spare' or 'rebuilding' that says online but is not really online]

- это запускает пересеребряный процесс на всем vdevs, который должен повторно посеребрить.

Ожидайте перепосеребрения для окончания; Vdevs затем все укажет "онлайн" в земельном участке "ухудшенных".

Наконец, отсоедините упрямые удаленные диски:

zpool detach gggpool [unavailable drive]

Все здоровые пулы.

1
ответ дан 22 September 2013 в 08:58

Другие вопросы по тегам:

Похожие вопросы: