障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開
障害発生時に担当者へのオンコールを自動化「Grafana OnCall」がオープンソースで公開
https://www.publickey1.jp/blog/22/grafana_oncall.html
クラウド対応のログ可視化ツールとして知られる「Grafana」や監視システム「Prometheus」などを
開発し提供するGrafana Labsが、障害発生時に担当者へのオンコールを自動化できる
オンコールマネジメントソフトウェア「Grafana OnCall」をオープンソースで公開したそうで記事をシェアします。
Grafana OnCallは、システム監視ツールから受け取ったアラートが、
あらかじめ設定されたレベルを超えた場合に、
自動的に運用担当者にSMSやチャットツール、電話どで連絡を行う、
オンコールマネジメントと呼ばれる分野のソフトウェアです。
調べたところではATLASSIANのJIRAなども同様の形です。
また、アラートが大量に発生したときの対応も考慮されているそうで
なかなかよさそうな感じがします。
ちなみにオンコールされる従業員側は基本的に24時間いつでも呼び出される
リスクを背負って生活しているのに、それに対する対価がゼロだったりするので
この辺は改善してほしいところですが、労働組合めちゃ弱くて泣けますね。