2018年はシステムの障害とリプレースが重なり忙しい日々が続きました。2018年を振り返ると仕事をしていたか、休日は寝ていたかの記憶しかありません。体調も慢性的に悪く、社会人生活9年の中でワースト1位で「終わってる1年」は2018年と断言できるほど、心身ともにキツイ1年でした。
そんな1年で運用の仕事って案外面白いかもと考えることも多くあり、その理由を自分なりにまとめました。
現在メインで運用しているシステムはリリースされてから7年目で、正にバスタブ曲線の最終フェーズ通り、障害が頻発した1年でした。そして、それらの対応と並行でそのシステムのリプレースのプロジェクトが始まり、私はシステムの運用者として運用設計を担当していました。
その障害対応と、リプレースの運用設計に携わる中で感じたのは、やはりITILの管理プロセスにのっとり日々の運用ができているかどうかがシステムの運用として一番大事なポイントだと思いました。ITIL
ITIL (Information Technology Infrastructure Library)とは、ITサービスマネジメントにおけるベストプラクティス(成功事例)をまとめた書籍群です。また、ISO/IEC 20000のベースになっています。最新バージョンは、ITIL 2011です。 書籍群というと、マニュアルや報告書の束を思い浮かべるかも知れません。実際には、ITサービス管理の考え方を整理したもので、そのドキュメントの構成自体が、ITサービス管理のためのテンプレートになっています。
https://smart-stage.jp/topiscs/itm_keyword_relate/p2/
今回のタイトルとは正反対になりますが、ブログ記事で、当ブログでは一番読まれているのがこちらも参照していただければと思います。↓
やはりITILベースの運用が大事だと痛感
恐らく、何の障害もなくリプレースも当分先のシステムであれば、極論、システムの運用の仕事にITILの考えは必要なくても良いと思います。ITILベースで運用をすると各種更新しなければならない資料や、承認プロセスを経ないと進めないことがあるので、システム運用者としては、それらが煩わしく感じることもあるかもしれません。
では、どんな時にITILが真に必要な、そして、その価値を発揮するのかを考えると障害時とリプレース時の2つです。
何故、ITILが必要か
障害が発生した際に、すぐに原因に辿り着ければ、問題ないですが、関連システムが多数あるシステム程、原因究明に時間がかかることがあります。また、影響範囲の特定にも時間を要します。その際に必要なのは、どういった理由で、システムの設定はされたの(変更されたの)かを正確に辿ることができる「変更管理台帳」そして、関連システムや周辺の影響のあるシステムを正確に管理するための「構成管理台帳」また、過去に似た障害がなかったかを確認するための「問題管理台帳」
上記は、ITILでいうとことろの「変更管理」「構成管理」「問題管理」のプロセスとその台帳が普段の運用でまわっているかということです。正直、ITILベースの運用は作業者からすると、各プロセスに対して承認があったり、記載すべき台帳が多く、面倒に感じると思います。現に、私の関わっているシステムもなんとなくこのITILベースの運用ができているものの、全てきちんとできていなかった。その結果、障害対応のスピードが遅くなったり、昔からシステム運用している人の曖昧な過去の記憶を頼ったり(属人化)と運用としてのベストな対応ができていないことがありました。
リプレースに関しても同じです。変更管理が正確にできていないと、既存の設計書と異なる点があり、システムの構築担当者は困ります。その結果、なぜ、設計書と異なる部分があるのかを運用者に尋ねますが、運用者も正確に把握手出来ていないと、「なぜ、設定が変更されたのか」を調査することに時間を要してしまいます。
運用の見直しで見えてきた、運用の面白さ
上記の通り、ITILベースの運用ができていない点があったことのつけが一気に回り、その結果、私を含めシステムの運用者を疲弊させる1年でした。
今、システムのリプレースを良い機会をとらえ、各種の台帳とプロセスを正確にフロー図化したりして運用を見直しています。既存の運用メンバーでは中々進めることができなかった作業ですが、色んな場所で、色んなシステムを運用してきた方で、かつ、ITILに詳しい方が今の運用に関わってくれるようになったことで、運用を一から見なすことが可能になりました。
ITILは知識として知っていても、それを実際の運用現場に導入するのにはとても骨が折れる作業になります。ただ、今、運用を見直して各種台帳や、フロー図を作成している中で、感じた面白さは、「運用の見えるか化」だと感じます。このインシデントの場合はどうなのか、こういう障害の際は、どこに連絡が必要で、いつまでに何をしないといけないのかなど・・・こういった、それぞれの作業を「見える化」させる能力って、実はとても高度な仕事で、かつ、色んな場面に役立てることができるのではないかと思えるようになりました。そして、この「見える化」が出来ていない企業(情報システム部)って沢山あると思います。クラウド化されるとIT技術者の数は今よりも少なくなると言われていますが、運用は必ず残ります。今よりも少ない数かもしれませんが、必ず運用は残ります。その際に必要なのは、やはり運用の見える化=ITILベースの運用の確立だと考えるようになりました。
それができる人は、将来も生き残れるし、何よりも頭を使えて楽しいです。システム運用の仕事は構築と比べると一見地味で面白くないように思えます。正直運用者としてワーカーだけやってると、その通りだと思います。でも、幸い今の自分はこの「見える化」を進める立場にいることができます。しばらくは、その「見える化」できる力を磨きたいなと今は思えているので、運用の仕事もそんなに悪くないと思えている今日この頃です。
コメント