20260520
本番障害を起こした。
自分で引き起こしてしまったのはこれで2回目になる。
昨日、帰る前に本番で作業をしていた時に、本番で稼働中の作業フォルダをダブルクリックで開こうとした時、手が滑って「taihi.bat」というbatファイルにドラッグしてしまった。
それからコマンドプロンプトが1秒にも満たない時間で開き、なんか一瞬エラーっぽい文字が見えて「フォルダを引数で与えるbatなんてそうそうないからエラーで落ちただろ!」って思ってた。
チラッとbatファイルを見てみるとremのコメントアウトで「ファイルをコピー」だとか「コピー先のファイル名にタイムスタンプをつける」とか書いてあったので、まさか実際の本番のファイルを消し飛ばすなんてバカなbatファイルがこんなところに置いてる訳ないだろ!と思い込んで、連日の寝不足で疲れていた私は(←本当にバカ)深く考えず、ドラッグをしてしまったフォルダを軽くのぞいて特に変わっていなかったので、気にせず帰った。
後の調査時にbatファイルの処理をきちんと見たところ、ハードコードで本番のフォルダ名が書かれており、その中の深い階層にあるファイルをなぜか消し飛ばす処理だった。訳がわからん。本番稼働前の試験で使用していたものがそのまま残っていたとか。
完全に地雷だった。私はそれを踏み抜いて見てみぬフリをしてしまった。
今朝、会社携帯を覗くと大量の留守電と永遠と続いているTeamsのチャットがあって冷や汗が止まらなかった。それから30分程度項垂れて、そこからは無心で二次障害の対応を行っていた。
地雷があったとは言え、踏んで無視していたのは私なので、きちんと謝りました。チャットでの雰囲気は「仕方ないねー。」って感じでそれよりも対応で手一杯で詰める的な部分は少なかったけど、私の見えないところで会社では何か文句を言われている気がする。
今日が在宅だったので幸か不幸か、職場の雰囲気はわからなかった。チャットは燃え上がっていたのでいい状態では間違いなくないのだけど。途中から出社へ切り替えた方が絶対に良かったな〜、反省。
こういう辛い状況を真正面から乗り越えた時、エンジニアとして、社会人として強くなれる気がする。上司たちからの信頼みたいなものは少し失ったけれど、そう言うのを自分の糧として将来的な笑い事にしたいね。とりあえず今日は、朝イチで「私がやりました。」と言えた自分に乾杯。
こんなとき、謝罪をすると言う行為に本質的な意味はないことはわかっているものの、実質的な意味は強くあるのだなと思った。
よく、エンジニアは重大なインシデントが起こった時は人を責めている訳ではなく、仕組みの根本原因を追求して再発防止を徹底するものだ、みたいなことが論じられていることがある。その仕組みは正しくて本質を付いている、ごもっともだと思うので私は好きである。
だから、緊急会議が開かれた際に
「私がミスりましたが、そもそも地雷をこれまで放置していた環境が悪い!環境や体制を見直すべきだ!」
という方向で発言をすることが物事を解決や再発防止に最短で進められる方向性・本質的なことだとは思っているし、そう切り出した方がいいのかなも少しよぎった。正直、本音はそちらの方が強い。
ただ、組織や社会ってそんなに正しい本質で動いている訳ではなく、思ったよりふんわりしている。
少し寄り道になるけれどまずは「私が間違えました。このようなことをしてこうなって、だからこう思って行動したのですが、誤っていました。」
このように言えることが重要で、それを少しでもうまく言おうとした自分に少しホッとしている。組織も賢いので、私はそこまで詰められず、最終的には体制が悪いよね、って方向性の話に進んできた。
とりあえず、明日は関係各所に対応をしてくれた上司に謝罪をするところから始めよう。私も明日も今日終わらなかった対応と、本来やるべきだった今日明日の仕事に追われる日々となる。散々でこの上なく億劫だけれども、頑張ろうかね。