Email or username:

Password:

Forgot your password?
Top-level
Taciturn

@skobkin Опрос завершился. Соответствует ли результат реальности?

6 comments
Alexey Skobkin

@Taciturn
Узнаем через ~неделю.

Пока что только мисматчи в массиве чинятся.
Потом еще проверять результат, потом проверять ФС, потом собирать новый массив когда диски придут, потом копировать данные (если ФС оживёт).

Пока что я успел посчитать весь рейд и найти ~67к мисматчей, которые сейчас чинятся.
Ну и еще забрал запасной диск обратно и поставил его как горячую замену.

Когда будет о чём писать - напишу.

В целом такое количество мисматчей - это, кажется, не конец света. Они тупо могли за годы с выключениями света и сбоями контроллера накопиться даже без болезней дисков. UPS-то был не всегда, да и контроллер дешёвый.

@Taciturn
Узнаем через ~неделю.

Пока что только мисматчи в массиве чинятся.
Потом еще проверять результат, потом проверять ФС, потом собирать новый массив когда диски придут, потом копировать данные (если ФС оживёт).

Пока что я успел посчитать весь рейд и найти ~67к мисматчей, которые сейчас чинятся.
Ну и еще забрал запасной диск обратно и поставил его как горячую замену.

67K mismatches on RAID 6 array.
Taciturn

@skobkin > накопиться
Может стоит добавить в cron, хотя бы раз в пол года (а лучше раз в три месяца) проверку (echo check > /sys/block/md127/md/sync_action)?

Alexey Skobkin

@Taciturn
Так, ну "repair" прошёл и нашёл ровно столько же мисматчей, сколько было найдено ранее.

И это уже хорошо. Значит они как минимум не растут в реальном времени.

Сейчас немного раскидал диски по разным контроллерам и повторяю "check". Скорость проверки заметно повысилась. Посмотрим, что найдёт.

Файловая система всё ещё поломана, но я её и не собирался чинить до того как RAID будет приведён в порядок.

Посмотрю, что покажет повторная проверка и буду запускать починку ФС.

А пока успел получить два из пяти новых дисков.

@Taciturn
Так, ну "repair" прошёл и нашёл ровно столько же мисматчей, сколько было найдено ранее.

И это уже хорошо. Значит они как минимум не растут в реальном времени.

Сейчас немного раскидал диски по разным контроллерам и повторяю "check". Скорость проверки заметно повысилась. Посмотрим, что найдёт.

RAID stats after "repair".
Alexey Skobkin

@Taciturn
"check" после "repair" показал 0 мисматчей.
Запускаю проверку ФС (пока readonly) чтобы оценить масштаб бед. В прошлый раз там были дикие простыни находок.

Alexey Skobkin

Так.

Ну не одним же рейдом веселиться, правда?

Стал запускать полученные новые диски для нового рейда и из пяти:

- Один не запустился вообще
- Один оказался 12 ТБ в корпусе 20 ТБ

🎉

Успех!

#hardware #HDD #Ozon #fun #log #server #RAID

Go Up