当社では、開発した後のシステム運用までサポートさせて頂くケースが多くあります。
実際のところ、システムは稼働した後に初めてメリットが生まれるものですから、その体制如何がお客様の満足度に直結すると経験的に理解しています。
開発、プログラミングという工程は、いわゆる「製造」に近いものなので、いろいろなテストの手法が研究されていたり、お客様の方も熱心に受け入れテストを実施するので、ある程度「自動的に大きな問題を事前に把握する」ことができるのですが、運用となると少し異なります。
実際に動いているシステムに対していろいろな作業を行ったり、軽微な修正を行ったりといった人が行う作業が中心となるので、どうしてもミスがついて回ります。そして悪いことに、開発中のミスと運用中のミスを比較した場合、ミスの程度は同じでも、ほとんどの場合、影響は運用中の方が大きくなってしまいます。
つまり、「システムの品質を高めるためには、開発中のエラー(バグ)はもとより、運用のエラーを防ぐ」ことが非常に大切である」ということが言えると思います。
当社では、運用のエラーを防ぐために「障害報告会」を2ヶ月に一度行っています。
ここでは、いくつかのユニークなルールと障害を防ぐためのしかけがあります。
ルールの例
・失敗を絶対に叱責しない
・解決すべき問題か、そうでないかを議論する
・解決すべき問題だとなった場合、どうすれば根本的に解決できるかを議論する
(次は気をつける、とかツーマンオペレーションにする、といった努力に依存する解決策は、解決策として取り上げません)
・問題の解決方法が合意できたら、そのタスクを会議の場でイントラネットに登録する(カイゼン事項)
・さらに、以前からのカイゼン事項の進捗と、それによる効果を検証する
たとえば、「ドメインの有効期限が切れてしまった」などという問題が起きた場合、当社では「担当営業が1ヶ月に1回確認する」などの方法は解決方法として採用しません。それでは営業マンが忘れた時に、解決策として全く機能しなくなるからです。
ではどうするかというと、当社では、これを監視システムに組み込むことで解決しました。
ドメインの情報は、レジストラと呼ばれる管理団体によって、有効期限などがネットで検索できるようになっています。当社ではこの仕組みを用いて、当社が管理しているドメインの有効期限が近づくと、自動的に監視システムから警告が送られるようにしました。
これにより、人手を介することなく、運用レベルを一段高めることができるわけです。
(ちなみに当社では、ドメインと同様にSSLサーバー証明書も監視システムでチェックしています)
昨年、某航空会社でサーバー証明書の更新ミスにより航空機のチケットがとれなくなるという事故がありましたが、これなども上のような対策をきちんとしていれば防げたはずです。
どれも「当たり前」の事ばかりですが、凡事徹底こそが品質向上、ひいては顧客満足度向上には欠かせないと確信しています。
クリエイティブでもイノベーティブでもありませんが、最後にはこうした取り組みが必ず評価されると信じて、地道な活動を続けています。
「ジミッ!」などと言わずに、暖かい目で見守ってやって下さい。