障害の捕捉

Yojiro Kondo
Aug 18 '19 · 1 min read · 266 views
NotionはSaaS のため外的要因で障害が発生します。またツールの特性上、障害が発生したときのダメージは計り知れません。
能動的に障害をキャッチするために、サービス監視ツールを入れるのもよいですが、Notionが公式で提供しているのはTwitterとステータスページです。
Notionの障害をいち早くキャッチできる仕組みは構築しておきましょう。ステータスページの方はメール通知も可能なため是非登録しておきましょう。
別途SaaSのサービスモニタリングツールも有用です。 この分野では、Catchpoint が有名でしょう。
また、障害発生時のチーム内への周知方法も確立しておきましょう。
いつ、だれが、どんなタイミングで、だれに、どう周知するのか。
最悪のパターンを考えて Slack だけでなくメールなどの方法もコンティンジェンシープランとして検討しておきましょう。SlackもAWSをベースに作られているため、同一の障害を拾いやすいためです。

Updating...

Share on