雲勉 実践!SLI/SLO with New Relic! を閲覧した

  • 投稿者:
  • 投稿カテゴリー:event

第89回 雲勉【オンライン:初心者向け】実践!SLI/SLO with New Relic!を閲覧した。わかりやすく勉強になった。考え方をメモしておく。

Google SRE

・SERの原則としてシステムやサービスの最も重要な機能は信頼性。信頼性がなくなると顧客からの信用、関心をなくす。
・信頼性と機能追加は両立できないため、信頼性を100%にする考え方は間違っている。
・SREの目的はサービスの信頼性欠如のリスクと開発速度、運用効率性のバランスをとるためのプラクティスや考え方や役割。

SLI/SLO


・信頼性は高いほうがよいわけではないため、重要なのはどこで線を引くか。
・サービスがうまく稼働しているの見分け方は、サービスが継続して稼働できる可用性やサービスの応答速度であるレイテンシーなど明確な値を計測して判断する必要がある。
・例えばあるページの応答速度が2秒以内である割合が99%以上にするであれば、「ページの応答速度が2秒以内」がSLI、「99%」がSLO。
・ユーザが期待しているようなことやユーザが満足するであろう項目をSLIに定義すべし。
・目標やしきい値をSLOとして策定する。これは達成できればユーザが満足する、達成できなければ不満をもつギリギリの値を持つべき。測定期間の設定を忘れないこと。
・SLOを99%とすると、1%は許容できると考えて有効に利用すべし。
・適度なサービスの品質を保つことで、高いパフォーマンスの維持につながる。