- 2022-07-19
- 2022-07-19
“実践”システム障害対応:2週目:アラート・故障申告の分類
12週にわたり「”実践”システム障害対応」と題して、システム障害対応の改善のプロセスを約3か月で実行できるように、各週ごとに何を実践すればよいか?を考えていきたいと思います。 1週目では、「アラート・故障申告」の棚卸がなぜ大事なのかについて、以下3つの考えをご説明させていただきました。 ■なぜ棚卸が […]
12週にわたり「”実践”システム障害対応」と題して、システム障害対応の改善のプロセスを約3か月で実行できるように、各週ごとに何を実践すればよいか?を考えていきたいと思います。 1週目では、「アラート・故障申告」の棚卸がなぜ大事なのかについて、以下3つの考えをご説明させていただきました。 ■なぜ棚卸が […]
今週から12週にわたり「”実践”システム障害対応」と題して記事を書かせていただきます。 システム障害対応の改善のプロセスを約3か月で実行できるように、各週ごとに何を実践すればよいか?を考えていきたいと思います。 それを実行した結果として、顧客との関係がより良いものになり、顧客にとっての成功(顧客の利 […]
システム障害対応の参考になる書籍や最新の考え方を教えて!と思っている方も多いのではないでしょうか。 今回は、私が仮に「システム障害対応のプロセスをゼロから作りたいと考えているんですが、参考になるものを教えてほしい。」と聞かれた際に、簡易的なプロセスならば前回ご紹介した「PagerDuty Incid […]
インシデント管理ツール 何を基準に選びますか? システム運用されている方ならば、インシデント管理ツールを使われていると思います。上司などから「こんな感じに選ぶといいよ」とご指示があったかと思いますが、さらに一歩上の課題解決ができるメリットがあればと願って記載いたします。社内システム運用の責任者や、改 […]
システム障害対応の参考になる書籍や最新の考え方を教えて!と思っている方も多いのではないでしょうか。 本記事では、システム障害対応の改善を進めるにあたり、参考になった書籍や考え方などをご紹介いたします。 今回は2016年頃に話題となったSRE(Site Reliability Engineering) […]
今回はインシデントレスポンスサービスをご紹介させていただこうと思います。あまり聞きなじみがない方もいらっしゃるかもしれませんが、私の解釈ですと「インシデント発生から暫定対処まで」に着目したサービスです。ただ、インシデントレスポンスという言葉が出回り始めたことはセキュリティ方面からだったみたいです。 […]