
もっち
- 関東大手SIer勤務
- 10システム、仮想サーバ約200台の基幹系システムが稼働する仮想化基盤のインフラ運用リーダー
以下3点について、ブログで役立つ情報を発信
- インフラ技術・システム運用
- キャリア・マネジメント
- エンジニア実務・仕事術


もっち
以下3点について、ブログで役立つ情報を発信
「誰よりも技術に精通しているはずの自分が、なぜか現場を混乱させてしまう」
障害発生の報を受け、真っ先にコンソールを開き、ログを追い、ソースコードの迷宮に飛び込む。エンジニアとしてこれほど頼もしい姿はありません。しかし、ふと周りを見渡したとき、チームメンバーが手持ち無沙汰にあなたを眺めていたり、チャットツールで状況を問う顧客の声を無視してしまっていたりすることはないでしょうか。
もし心当たりがあるなら、あなたは「技術力という罠」にハマっているかもしれません。
障害対応の現場で本当に試されているのは、コードを書く力ではなく、現場を支配する「リーダーシップ」なのです。
この記事の想定読者
この記事を読むことでのメリット
かつて、障害対応は「知っているか知らないか」の勝負でした。しかし今は違います。 高度化したAIツールは、エラーログを投げれば即座に原因の仮説を立ててくれます。保守ベンダーのサポートも、専門領域においては私たち以上の知見を提供してくれます。
つまり、純粋な「技術力」はすでに外部から補完可能なリソースなのです。
一方で、AIやベンダーが決して代行してくれないものが2つあります。それが「判断」と「責任」です。それらをここではリーダーシップと定義しています。
障害が発生した際、対応に必要な上記の判断を行い、その判断によって生じる結果の責任を引き受ける。それがリーダーシップの仕事です。
現場で「空回り」してしまう中堅エンジニアには、共通の失敗パターンがあります。
ある現場では、凄腕のエンジニアが数時間で問題を解決しました。しかし、その間エンドユーザーへの報告はゼロ。顧客は「いつ直るのか、そもそも状況を把握しているのか」という不安に晒され、最終的に技術的な解決とは裏腹に、深い不信感だけが残りました。
一人のメンバーに指示が集中し、他のメンバーは「何をすればいいかわからない」と待機状態になる。一人が作業を抱え込むことで、情報の連携が途絶え、結果として対応時間が物理的な限界を超えて延びてしまうケースです。
これらはすべて、「自分が作業者として動くこと」に固執し、「リーダー」としての役割を放棄した結果に他なりません。
もちろん、技術力が不要なわけではありません。むしろ、リーダーシップと組み合わさったとき、技術力は最大の武器になります。
かつて、仮想サーバ上のWindows OSが突然再起動する原因不明の事象がありました。ハードウェアベンダーは「異常なし」と回答。ここで諦めるのは作業者です。 しかし、あるリーダーは違いました。OSベンダーと連携し、メモリダンプを解析。「これはファームウェアの不具合である」という動かぬエビデンスを突きつけ、ベンダーに不具合を認めさせ、修正リリースの約束を取り付けるまで粘り強く交渉を続けました。
この成功の要因は「ダンプが読めたこと」だけではありません。「原因を特定し、解決まで導く」という強い意志と、関係各所を動かしたリーダーシップがあったからこそ、技術力が形になったのです。
障害対応のリーダーシップは、一朝一夕には身につきません。しかし、日頃の「振り返り」の視点を少し変えるだけで、その力は劇的に向上します。
多くの人は障害後に「手順」を復習します。しかし、同じ障害は二度と起きないかもしれません。 次に振り返りを行うときは、以下の項目を自分(またはチーム)に問いかけてみてください。
手順をなぞるのではなく、「判断のログ」を刻むこと。 その繰り返しが、いかなる未知の障害が発生しても、揺るぎない基準を持ってチームを導く「真のリーダーシップ」を形作ります。
技術の先にある、信頼を勝ち取るエンジニアへ。 次の障害対応では、まずキーボードから手を離し、深呼吸して、チームを見渡すことから始めてみませんか。
この記事が気に入ったら
フォローしてね!