Начну плакаться издалека. У меня сбойнул жёсткий диск. Итого резюмируя, за относительно небольшой период времени один жёсткий диск сдох, другой работает после реанимации, третий готов последовать за первыми двумя. У меня при каких-либо не понятках с HDD начинается нервный тик.
Из трёх HDD дисков уже давно один сдох - 500 Гб Seagate Barracuda 7200. Барракуда мне никогда не нравилась - горячая зараза. По сравнению с зелёной серией WD барракуда была горячее почти на 10 градусов Цельсия.
У второго HDD 750 Гб WD Green был сбой и SMART показал, что бобик сдох и таблица G-list переназначенных кластеров полна и диск нужно выкинуть. Друг-электронщик мне его реанимировал каким-то неведомым чудом и теперь диск в строю. Ну как в строю. При старте компьютера, BIOS орёт: "спасай данные", но уже пару лет диск робит. Кстати, раньше в эпоху моих безудержных экспериментов с файловой системой btrfs, этот диск был в btrfs и, только спустя многие годы, я форматнул его в ext4.
Недавно аппаратно сбойнул третий HDD WD Green 1 Тб. Игра начала лагать. Выхожу из игры, а мне пишут ... диска нет =(. В логах куча упоминаний об отвалившемся диске. После таких вещей я начинаю дёргаться и психовать. Что смог сделать? Вычистил весь комп от пыли. Диски извлёк и протёр тряпочкой. Все шлейфа SATA заменил на новые, голубые SATA 3 с щеколдами. Судя по forum.ubuntu.ru, это шаманство не раз выручает.
Мне говорили, что желателен хороший блок питания (БП), но он давно был заменён с одного хорошего на другой хороший БП от друга Виталия, который шарит в электронике и различает Ватты от Милливольт-Амперов и разбирается в других умных словах. Добавьте к этой ситуации, что у меня Источник Бесперебойного Питания (ИБП), то есть сбои по питанию мне не грозят.
Аппаратная ошибка вроде пропала. SMART, чьи параметры я никогда не понимал до конца и не умею их интерпретировать, выдаёт что вроде всё в порядке. Сделал проверку всех дисков с помощью fsck через приказ: sudo touch /forcefsck && sudo shutdown -r +0
. Ошибки починились, судя по отчёту fsck.
И тут "сломался" мой синхронизатор с облаком Ubuntu One. Раскрутил проблему и оказалось, у меня после сбоя на диске поселилась папка, которую я не могу удалить и она вызывала проблему. Что странно, я могу налагать права на папку, могу менять владельца, могу переименовать родительскую папку, но не могу удалить "сбойную папку". Пока я переименовал родительскую папку и UbuntuOne заново создал, что ему было нужно и заработал.
Вот сижу, чешу репу, гуглю - как удалить неудалямое? Дополнительных атрибутов на папке нет, этот финт ушами я знаю. На папке могут быть специальные атрибуты типа бита -i (immutable) и даже админ не сможет удалить файл или папку, пока установлен такой бит. Но биты не выставлены и команда lsattr не врёт.
Форматировать весь диск, сохранив файлы, пока просто влом. Пока есть только одна мысль, найти время и запустить о-о-о-о-очень долгую процедуру поиска плохих участков с помощью не разрушительного теста badblock'ом или вынуть диск и прогнать на стенде у Виталика через утилиту Викторию.
Знакомые, услышав эту историю, в один голос утверждают: "А что ты хотел? Если диски старше 3-5 лет, то следует готовится к их замене." Может скажу ересь, но я не готов морально и физически покупать диски раз в пять лет. Мой первый жёсткий диск на 1 Гб верой и правдой служил много лет. Да, конечно, раньше плотность записи у HDD не была как сейчас и, возможно, новые диски более "капризные".
По логике, файловая система не должна заморачиваться вопросами сбойного оборудования. Но моя ситуация показала мне, что в ext4 кроме собственного журнала нет технологий, которые выручат в таких неприятных ситуациях. Из того что знаю, Гугл использует ext4 без журнала и не заморачивается с восстановлением данных, так как хранится всё в Гугле в нескольких местах. Для гугла проще и быстрее развернуть заново ноду, убрав после сбоя диск.
Из того что читал, ZFS хороша тем, что не доверяет оборудованию и создавалась под прицелом, что SATA диски могут выдавать ошибки. Но ZFS одно время была не нашей файловой системой из-за различия в её лицензии и лицензии ядра линукс. Сначала ZFS появилась как файловая система через FUSE, но это тихий ужас из-за низкой производительности. Затем ZFS появилась в ядре через какой-то юридический трюк с прослойкой-модулем ядра. Хотя следует признать, ZFS это не чистая файловая система. Она ещё задевает нижележащий уровень, на котором так же работают Linux RAID и LVM. Может попробовать ZFS?
Вот впереди маячит неприятная перспектива. Система установлена на 32 Гб SSD диск OCZ "Onyx" OCZSSD2-1ONX32G с контроллером Indilinx Amigos с ext4, так как в своё время я огрёб с btrfs лишние для меня проблемы. Три HDD, как ступени у ракеты, готовы отвалиться, чтобы я остался с одним SSD и летел дальше в светлоетёмное будущее.
Не поленитесь и отпишите, чтобы вы посоветовали сделать, что проверить и к чему готовиться?
Похожие материалы:
ZFS в Ubuntu.
Установка Ubuntu Linux на SSD.
Правда о Goobuntu. Google Ubuntu Linux.
Жизненные истории. Электронщик и Ubuntu Server.