青葉台駅伝言板

考えをまとめるための日記。頭を整理するごとに書き換えてしまうので、そんなつもりで優しく見てくーださぃ

スキルと経験の活かし方に悩む

10年ぶり以上で、システム運用監視の部署のヒトの話を伺った。

 

システム運用監視って何?というヒトもいるかも知れない。まあ、各企業で使っている情報システムの安定稼働監視とシステム運用業務を行ってくれる部署なので、子会社や外部委託してるかもしれないけど、大きな会社にはおおよそある機能かもしれない。求められるサービスレベルによって、体制のサポート期間は平日日勤帯の場合もあれば、24H365Dの場合もある。

この業務、問題が起きなければ暇になって眠たくもなるんだけど、一旦事件が起きると、上を下への大騒ぎになることがある。システムはたくさんあるので、通常は沢山のヒトが必要になる。そういう部署の効率化、コスト削減って、10年前もやっていたけど、その最新の方向性を聞いてみた。

 

① 監視と運用は別物。監視の自動化はいろいろ手段もあって、ツールも提供されている。

② 受け付けるにあたり、まずは自動化を徹底してやる。ここは監視も運用もあるけど、むしろ運用の側面が強いかもしれない。ここでいう自動化は今流行りの生成AIではなく、いわゆるスクリプト化で自動化できるもの。これをシステム作る人もやるし、運用監視を受け入れるヒトも徹底してやる。障害を検知しても、それを緊急に対処すべきなのか、翌営業日で良いかがわかってれば、アラームが必ずしも必要ともわからない。

③ 監視対象は、昔はオンプレサーバも多くあったけど、今はクラウドが主流。このため、主要クラウドの監視ツールには精通して、クラウドならではの動きも見る。クラウドも、CPUの負荷率が高まっても、オートスケールによる制御もしてくれるから、クラウドのツールに精通していることが望ましい。

④ システムは立ち上がっているけど、想定通りに動いていないやつ。これも見つける。プログラムが動いてないと、サービスも対応できてないけど、当然エラーもでないので、これまでは見つけにくかったのも、予めわかっていれば見つけられる。

 

そんなこんなで、何百人いたチームが1桁少ない人数で回っている。コスト削減の観点で言えば、すごい!の一言。

でもこの残ったヒトは、クラウドの知識も、各システムやサービスの知識がある方が望ましいし、結構高いスキルや知識が求められるスーパー人材になるんだけど、でも日々の仕事が忙しいわけでもなく、優秀な経験をどう活かそうかというジレンマに陥って、なり手がいなくなったり、人材獲得のジレンマがあるという。

 

 もちろん、ここに生成AIを組み合わせてというのも選択肢にはあるが、いくつか問題がある。この問題は別なときにまとめておくけど、一言で言えばブラックボックス化したあとに、生成AIの知ったか、というか誤解とどう対峙するかということかな。

 

 10何年ぶりに古巣の仕事を聞いて、非常にこちらはモチベーションが高まった。でも説明してくれたヒトは古巣に10何年以上継続して頑張ってくれているわけで、本当に頭が下がる。