テックブログ

システム運用

運用でカバーをする・しないのお話

おはようございます。技術部の田中と申します。
この挨拶というものは、読む人の時間によって変わるという話もありますが、
はじめての記事ですので、今回はあえておはようございますで、
私が書く場合は今後もおはようございますだと思われます。

さて、他の方々が技術ネタで完全にコマンドとか知識系が多いですし、
せっかくなので考え方についてお話してみたいと思います。

今回、お伝えしたいのは、「運用と合理化」についての考え方の一つです。
問題が発生した際の対処の運用と、その合理化です。

運用でカバーする」という言葉を聞いたことあるでしょうか。IT業界に限った話ではないですが、
仕組みやシステム面で何らかの不都合、手の届かない場所、あるいは発生しうるミスが存在します。
それらに対して、よく「運用でカバーする」という言葉で、その場その場で対処するような経験、
皆様にあるでしょうか。

そういった前提が存在する上で、「運用でカバーをする」というものは、
一概に良い悪いが言えるものではない部分はあります。

今回はそういった善悪を問うのではなく、発生するメカニズムから考えてみましょう。
「運用でカバーをする」というのは、システム面に欠陥があり、それを根本的に対策する
余裕がない」「余地がない」「予算がない」の3Yとでもいうべきものから来ているでしょう。
ちなみに、それぞれの言葉の意味は以下のように使っています。

余裕がない」 ・・・ 根本的な対策を行うことができる人が忙しい(ゆえに余裕が無い)

余地がない」 ・・・ 根本的な設計上それ以上変更が効かない状態(ゆえに改善の余地がない)

予算がない」 ・・・ 改善するにかかるコストの予算がない

 

ここからは喩え話になります。喩え話が苦手な方や、結論だけ知りたい方は太字の部分だけ読んで、あとは読み飛ばしても問題ないです。
インスタントの焼きそばを作ります。昔ながらの四角い箱のやつですね。
まずはインスタントの焼きそばを買ってきて、蓋を開けます。
お湯を注いで、3分ぐらい待ちます。人によっては5分とか2分とかですが、そこは好みです。
そして、蓋を少しだけ開けてお湯を捨てようとしますが、蓋がべこっと開いてしまい、
焼きそばがこぼれてしまいました。いわゆるところの湯切りの失敗というやつです。

ここまで書いていて思ったのが、インスタント焼きそばって、
どうしてお湯で作ってるのに焼きそばになるんでしょうね。
そこは今回の本筋とは関係ないのでおいておきます。

なぜ、焼きそばがこぼれてしまったのでしょうか。

これに対する対策を考えてみましょう。「運用でカバーをする」パターンです。
湯切りの際に、ざるを持ってきて、
そのまままるごと焼きそばごとお湯をそこで湯切りしちゃいましょう。
それが嫌なら、お箸やフォークで焼きそばを抑えてお湯だけが流れるようにしましょう。
ほんのちょっとの工夫で湯切り失敗して、焼きそばがダメになることがこれでなくなりましたね!

--と言いたいところですが、これだと得意な人と苦手な人がいます。

誰がやっても同じ結果になりません。
ざるに向けて焼きそばごと湯切りしようとしたら、
ざるがひっくり返ってやっぱりこぼれてしまいました。
お箸やフォークで抑えても、その隙間から流れでてしまいました。

「運用でカバーができる」というのは個人技能に依存するものです。

では、誰でもできるようにするにはどうすればいいのでしょうか。
そのためには「運用でカバーをしない」方法を考えてみましょう。
別の言い方をすれば、原因の排除として、仕組みによる対策を行うことです。

そもそもの焼きそばの箱に、湯切り専用の仕組みがあれば、焼きそばはこぼれません。
湯切り用の穴からお湯を抜いてしまえばいいわけです。
実際にそういうインスタントな焼きそばがほとんどでしょう。

つまり、「仕組みによる対策」とは、万人向けのためのものになります。

 

では、「運用でカバーする」と「仕組みによる対策」、どちらを取るべきなのでしょうか。

結局のところ、両方を比較して、どちらがより合理的かで判断するしかありません。

その問題が発生することで、起きうる影響が、
数十万人規模や、数億円規模などの大問題であれば、
仕組みによる対策を早急に行うべきでしょう。

逆に、とても軽微な問題で、綺麗じゃないから気分が悪いといったものや、
根本的な対策を行うとかえって余計な手間暇やコストがかかるのであれば、
運用によるカバーで十分といえます。

もちろん余裕があれば、可能な限り「仕組みによる対策」は行っていくべきでしょう。
現実問題としては、全ての仕組みを完全にするのはとても難しいでしょう。
モノ・カネ・ヒト、リソースをつぎ込む必要が多大にでてしまいます。

優先順位をつけて、
「運用でカバーする」のか、
「仕組みを改善する」のか、
それはしっかりとその問題に対しての理解が必要になってくるでしょう。

しかしながら、どちらを選ぶにしても、問題が発生したら、早急に対処する必要があります。

我々ネットアシストが行っているサーバ監視というものは、
「サーバに異常があった時に素早く対応を行う」ことをいたします。
この考え方に当てはめる場合は、お客様視点であれば、
「異常への素早い対応」という仕組みをアウトソーシングによって提供するので、
サーバ運用に対するソリューションとしては、「仕組みによる改善」となるでしょう。

もしサーバ運用において

「今後、素早い対応をしていきたいが、どこに依頼をすればいいか分からない……」

といった悩みがあれば、ぜひともネットアシストにご相談ください。
それぞれのケース、状況をしっかりとヒアリングした上で、
適切なソリューションを提案させていただきます。

 

【まとめ】

問題への対処方法は大雑把には以下のいずれか

①運用でカバーする ・・・・・・ 工夫や一手間を加えてのカバー

②仕組みを改善する ・・・・・・ 問題が起きない仕組みづくり

合理的な問題への対処方法の選び方の基準

  • 問題の重要度
  • 発生するリスクへの許容度

問題に対しては優先順位をつけて、対処のアプローチを決めるのが大事
そのためには、発生する問題に対する理解が必須

実績数30,000件!
サーバーやネットワークなど
ITインフラのことならネットアシストへ、
お気軽にご相談ください