砂の城

想定不足により深刻な障害が起きるというアンチパターン。障害が起きるまで放置するのではなく、想定をし、予防をしようというもの。とくに運用後の体制について記述されている。
ベンチマークを取っておく、テスト環境を用意する。例外処理をきっちりやっておく。RAIDだからバックアップを取らないなどというのはありえないなど。中でもポリシーを策定し、ユーザーと合意しておくということは最も重要だろう。
多分想定ができず、悲惨なことになる理由は以下のとおり。

  • 開発で手一杯でコストも期間もない
  • リスクが認識できない
  • リスクに対して、どうやっていいかわからない

また、仮に想定していたとしても、実際に起きた時に役に立たないということもある。たとえば、バックアップをとっていたが、十分ではなかったなど。
そのためにも、予めテスト環境などでリハーサルなどをやっておくべきであり、手順を明確にしておき、手順のミスによるさらなる事故を防がなくてはならない。