トラブルの振り返り(引き続き対応は残っていますが...)

木曜日からトラブル対応をしており、一段落した感じです。プログラム、データ移行の関係で「とりあえず稼働できる」という状態のため、対応完了まではもう少しかかります。 自分がわかっている範囲で書き出してみて、トラブルを未然に防ぐことはできなかったか検証してみようと思います。

  • トラブルの検知
    木曜日の夕方にトラブルであるという状況をみんなが知りました。本稼働が金曜日からだったので、前日の夕方にトラブルが発生しているという状況を知ったことになります。2〜3日にかけて現地で作業をしていたのですが、その最終段階になってようやく報告があがったのです。

  • 今回の作業内容とは
    そもそも今回の作業は何だったか、という話が必要だと思います。既存のお客様が対象となっており、パッケージ製品がバージョンアップされたこととサーバーの保守が切れることにより、ハードとソフトを入れ替えるというもの。ソフトはかなりのバージョンアップがされており、同一製品であるもののデータ移行もかなり大変な作業となります。

  • 事前準備は???
    データ移行やプログラムの納品を行うため、事前テストを行って現地へ適用することになりますが、その当然のことができていないということになります。SEにとっては当たり前かもしれませんが、そんな時間を作ることすらできなかったということもありえます。 今回のお客様を担当した人は、6月に部署で行ったイベントの主要な部分を担っている人であり、その準備と事後作業でかなり忙しくしていました。そして、新パッケージへのプログラム改修を行ったのはまだ新人に入る人たち。データ移行を担当したのは、もう少し周りへの気配りをしてほしいと思ってしまう人です。決して能力が無いわけではなく「他の人の担当だから手を出せない」と言って意識的に距離を置くようなタイプです。 この状況では指示を出すのが精一杯で、検証する時間を作るのは難しい状況となります。

  • 他の人たちは気づかなかったのか
    隔週で定例ミーティングを開いていますが、その中では特に議題に上がることはありませんでした。いつも厳しい状況にあるので、報告としてあげるという認識がなかったという状況だと思います。自分も似たような感じですし。 そうなると、周りの人が「やばい状況です!」と言わなければいけないのですが、携わっている人の中でその声をあげることができる人はいなかったのです。その声をあげる人がいなくても、スケジュール(進捗)管理していれば検証できていないことを拾うことができる。そう、できるはずなんです...

  • 誰が、何をすればよかったか
    今のやり方だと、誰がいつどの開発をするかはわかるけど、どれだけの実績があるか全然わからない。予定が入っていたから終わっているはず、というざっくりな感じ。途中経過がすっぽり抜けて憶測の結果だけが歩いているのです。 これをどうにかしなくてはいけないので、グループウェアとか入れて可視化するのがいいのです。ただ、それをやろうとすると費用がかかってしまう。そもそも「状況を把握するつもりがあるか」ということを確認しなくてはいけない。状況把握をするためには現状を報告させ、状況確認した後に対策をとるということ。対策をとるのがめんどくさいからそもそも状況把握をしない、そんな感じもします。 進捗状況の把握を含めて、誰かが突然いなくなっても対応できる状況を作らなければ、今回のトラブルを回避することはできないと思う。そのためにはグループウェアを入れるのが手っ取り早い方法。cyboze live は無料のわりにいい機能が入っているので、ここから入ってみるのもありではないでしょうか。

  • 今後の行動は? 進捗状況の把握、これができるように対策をとります。まずは進捗管理ツールを探しですね。Webベースのアプリ、自社開発、エクセルによるまとめ等々。個人的にエクセルは有りえません。そうなるとWebベースのアプリでしょうか。

何をどうやってもすべてを満足させるものはないので、その上でやり方やツール選びをしたいと思います。次に同じトラブルが起きないように、今のうちから準備を進めようと思います。