Мой сервер хранения в Ubuntu 18.04.3 LTS работал в течение полугода, довольно стабильно. Он использует zfs (raidZ) для раздела хранения.
Сервер работает в качестве резервного зеркала на другом сервере, который использует znapzend для частой отправки снимков. (У меня есть ощущение, что пул исчезает, когда znapzend начинает отправлять, однако почему только набор данных хранилища, а не база данных, я не знаю) На обоих серверах должна быть одинаковая настройка пула zfs, если я правильно помню, включая снимки и квоту. Оба сервера недавно получили полное обновление системы. «Основной» сервер не показывает проблем с наборами данных, они там не исчезают.
Пулы в резервной копии имеют refreservation и refquota, чтобы сохранить достаточно места для моментальных снимков.
pool quota none default
pool refquota none default
pool refreservation none default
pool/db quota none default
pool/db refquota 100G local
pool/db refreservation 100G local
pool/storage quota none default
pool/storage refquota 2T local
pool/storage refreservation 2T local
После последнего обновления всей системы Ubuntu пул / хранилище продолжает исчезать из файловой системы, но все еще отображается в zfs.
root@server:~# mount | grep pool
pool on /pool type zfs (rw,xattr,noacl)
pool/db on /pool/db type zfs (rw,xattr,noacl)
root@server:~# zfs list
NAME USED AVAIL REFER MOUNTPOINT
pool 2.11T 1.40T 104K /pool
pool/db 109G 90.6G 9.40G /pool/db
pool/storage 2.01T 1.39T 629G /pool/storage
Мой мониторинг сообщает о том, что несколько раз в день пул / хранилище возвращалось в файловую систему, а затем снова исчезало:
Отчет за 5:21, набор данных возвращался:
Host: backup
Alias: backup
Address: 192.168.1.11
Service: Filesystem /pool/storage
Event: UNKN -> OK
Output: OK - 52.9% used (1.06 of 2.00 TB), trend: +342.55 GB / 24 hours
Perfdata: /pool/storage=1109740.5;1677721.6;1887436.8;0;2097152 fs_size=2097152;;;; growth=4962844.988964;;;; trend=350775.45978;;;0;87381.333333
Снова исчезает в 6:07:
Host: backup
Alias: backup
Address: 192.168.1.11
Service: Filesystem /pool/storage
Event: OK -> UNKN
Output: UNKN - filesystem not found
Perfdata:
Я также не вижу ничего плохого в статусе zpool
root@server:~# zpool status
pool: pool
state: ONLINE
scan: scrub repaired 0B in 4h43m with 0 errors on Tue Aug 27 15:01:28 2019
config:
NAME STATE READ WRITE CKSUM
pool ONLINE 0 0 0
raidz1-0 ONLINE 0 0 0
sda ONLINE 0 0 0
sdb ONLINE 0 0 0
Что здесь происходит? Что я могу сделать, чтобы расследовать это поведение?