SQLサーバのデータ用HDDがあふれて、バックアップを削除しようとしたら、安全のためにバックアップデータを保管していた1TBのHDDが死んだので、再度バックアップをやり直したのが22日。
SQLサーバのデータはRAID5のドライブにいれているのですが、一番怖いのはBadBlock。
というわけで、利用者が少ない23日の夕方からBadBlockCheckを走らせたらなんとエラーを検知してしまいました。
で、25日の午前0時のトランザクションログのバックアップ中にRAID5が応答しなくなってしまってSQLサーバがハング状態。
できるだけのプロセスを終了させて、電源OFFで終了。
RAID5ドライブはホットスタンバイのドライブが入っていたので、電源再投入と同時にリビルドが始まって延々6時間よこで監視。SQLサーバ停止中のデータの登録やらで一日がつぶれました。
もう、これで壊れなければ良いんですが。