夏頃に導入したRAIDコントローラがじゃじゃ馬でなかなか安定してくれませんでした。
仕事でもよく使っていたLSIロジック社製のRAIDコントローラなんですが、新品のハードディスクを認識しなかったり、
BADセクターがあるとエラーを吐いたりと散々ですが、メーカー推奨のハードディスクは一般のバルクの3倍の値段なのでちょっと手が出ないので、安いハードディスクで試行錯誤していました。
ここ一ヶ月は調子良かったのですが、今週のあたまぐらいからクリティカル状態で1台ハードディスクが死んでるエラーが出てくるのですが、このハードディスクは先月新品と交換したばかりの代物で1ヶ月でエラーになるのはちょっとおかしいと思い、徹底的に修復を試みました。
まずは、データのバックアップなんですが、丸二日掛かりました。
それで、RAID構成を解除して、死んでいたハードディスクのポートには、長らく入手困難だったWestern DigitalのRED WD30EFRXを導入、それからもう1台リードエラーを起こしていたハードディスクはTOSHIBAのDT01ACA300に交換してみました。
本来RAID構成は同じハードディスクで揃えるのが定石ですが、まぁ趣味でやっているので結果オーライということで。
それからRAIDコントローラの新しいファームウェアとドライバーとマネージャーがアップされていたので、同時にアップデートしました。
あとは、SASのケーブルが怪しかったので、他のメーカーのケーブルと交換しました。
最後はとどめに刺していたPCI-Expressのスロットを変えてみました。
RAID5でイニシャライズに丸1日掛かり、リードテストに8時間掛かりました。ここまででエラーは発生しませんでした。
とりあえず、3TB分のデータを戻して、1日様子をみた後にリードテストを行ってみましたが、全くエラーが出なくなりました。
いやー安定稼働まで長い道のりでした。今もマネージャーを立ち上げて状態を見ていますが、全くエラー無しです。
おいおいデータを戻しつつ状況を監視したいと思います。
なんか堅い話ですみません。写真はWestern DigitalのREDです。


コメント