英語でSLO(Service Level Objective)を書くよう求められたとき、SLAとの違いや何を盛り込めばいいか迷った経験はないだろうか。
SLOはチーム内で合意する信頼性の内部目標だ。可用性・レイテンシ・エラーレート・エラーバジェットの5つのセクション構成さえ押さえれば、英語でも問題なく書ける。
この記事では、英語SLOに必要な5つの構成要素と、そのまま使える日英テンプレートを紹介する。コピペして使えばすぐに次のサービスのSLO設計で活用できる。
SLOに必要な5つの構成要素
SLO(Service Level Objective)はサービスの信頼性をチームが約束・管理するための内部目標文書だ。以下の5つが標準的な構成要素になる。
- サービス概要(Service Overview)
- SLI定義(SLI Definitions)
- SLO目標値(SLO Targets)
- エラーバジェット(Error Budget)
- レビュー・エスカレーション(Review & Escalation)
SLOとSLAの違い
SLA(Service Level Agreement)は顧客・外部との合意文書で、違反時にペナルティが発生する。SLOはチーム内の内部目標で、SLAより厳しく設定するのが一般的だ。SLAが「99.9%」であれば、SLOは「99.95%」に設定してバッファを持たせる。SLOを守ることで、SLAへの違反リスクを事前に検知できる。
SLAの書き方は英語SLAの書き方でも確認してほしい。
なぜ英語で書くのか
グローバルSREチームでは、SLOがモニタリングダッシュボード・アラート設定・ポストモーテムと同じリポジトリで英語管理される。英語で書くことで、海外メンバーがエラーバジェットの消費状況を即座に把握でき、インシデント対応の意思決定が速くなる。
テンプレートをダウンロード(Word)
以下のWordファイルをダウンロードして、プロジェクトに合わせてカスタマイズして使ってほしい。表の列・行はそのまま追加・削除できる。
📥 日本語テンプレートをダウンロード(Word)
📥 Download English Template (Word)
日本語版テンプレート(コピペOK)
サービス概要
| 項目 | 内容 |
|---|---|
| サービス名 | (例:決済APIサービス) |
| オーナー | (例:バックエンドSREチーム) |
| 対象環境 | (例:本番環境) |
| 最終更新日 | (例:2026年8月1日) |
| レビュー周期 | (例:四半期ごと) |
| 関連SLA | (例:顧客向けSLA 99.9%可用性) |
SLI定義(Service Level Indicator)
| SLI名 | 定義 | 計測方法 |
|---|---|---|
| 可用性(Availability) | (例:正常レスポンス数 ÷ 全リクエスト数) | (例:Datadog APMのリクエスト成功率) |
| レイテンシ(Latency) | (例:APIレスポンスタイムのp95) | (例:Datadogのパーセンタイルトレース) |
| エラーレート(Error Rate) | (例:5xxエラー数 ÷ 全リクエスト数) | (例:Datadogのエラーレートメトリクス) |
| スループット(Throughput) | (例:1秒あたりの処理リクエスト数) | (例:Datadogのリクエスト数メトリクス) |
SLO目標値
| SLI | SLO目標 | 計測期間 | SLA閾値 |
|---|---|---|---|
| 可用性 | (例:99.95%以上) | 月次 | (例:99.9%) |
| レイテンシ(p95) | (例:200ms以下) | 月次 | (例:500ms以下) |
| エラーレート | (例:0.05%以下) | 月次 | (例:0.1%以下) |
エラーバジェット
| 項目 | 内容 |
|---|---|
| 計算方法 | (例:エラーバジェット = 1 − SLO目標値。可用性99.95%の場合、月間許容ダウンタイムは21.6分) |
| 消費率アラート | (例:エラーバジェット消費率が50%を超えたらSlackに通知) |
| 消費率が100%に達した場合 | (例:新機能リリースを停止し、信頼性改善に集中する) |
| エラーバジェットポリシー | (例:消費率80%超で機能開発を停止し、SREタスクのみ実施) |
レビュー・エスカレーション
| 項目 | 内容 |
|---|---|
| レビュー担当 | (例:SREリード・プロダクトマネージャー) |
| レビュー周期 | (例:毎月最終金曜日) |
| SLO違反時のエスカレーション先 | (例:エンジニアリングマネージャー) |
| SLO改定基準 | (例:3ヶ月連続でSLOを達成できない場合、目標値を見直す) |
英語版テンプレート(コピペOK)
Service Overview
| Item | Details |
|---|---|
| Service Name | (e.g., Payment API Service) |
| Owner | (e.g., Backend SRE Team) |
| Environment | (e.g., Production) |
| Last Updated | (e.g., August 1, 2026) |
| Review Cadence | (e.g., Quarterly) |
| Related SLA | (e.g., Customer-facing SLA: 99.9% availability) |
SLI Definitions (Service Level Indicators)
| SLI Name | Definition | How to Measure |
|---|---|---|
| Availability | (e.g., Successful responses ÷ Total requests) | (e.g., Datadog APM request success rate) |
| Latency | (e.g., p95 API response time) | (e.g., Datadog percentile trace) |
| Error Rate | (e.g., 5xx errors ÷ Total requests) | (e.g., Datadog error rate metric) |
| Throughput | (e.g., Requests processed per second) | (e.g., Datadog request count metric) |
SLO Targets
| SLI | SLO Target | Measurement Window | SLA Threshold |
|---|---|---|---|
| Availability | (e.g., ≥ 99.95%) | Monthly | (e.g., 99.9%) |
| Latency (p95) | (e.g., ≤ 200 ms) | Monthly | (e.g., ≤ 500 ms) |
| Error Rate | (e.g., ≤ 0.05%) | Monthly | (e.g., ≤ 0.1%) |
Error Budget
| Item | Details |
|---|---|
| Calculation | (e.g., Error budget = 1 − SLO target. At 99.95% availability, the allowed downtime per month is 21.6 minutes.) |
| Budget Burn Alert | (e.g., Send a Slack alert when error budget consumption exceeds 50%.) |
| If Budget Reaches 100% | (e.g., Freeze new feature releases and focus entirely on reliability improvements.) |
| Error Budget Policy | (e.g., Suspend feature development when consumption exceeds 80%; SRE tasks only.) |
Review & Escalation
| Item | Details |
|---|---|
| Reviewers | (e.g., SRE Lead, Product Manager) |
| Review Cadence | (e.g., Last Friday of every month) |
| Escalation on SLO Breach | (e.g., Notify Engineering Manager) |
| SLO Revision Criteria | (e.g., If the SLO is missed for 3 consecutive months, revisit the target.) |
各セクションの書き方と例文
テンプレートを埋めるときに悩みやすいポイントを解説する。
SLIの書き方(計測方法まで定義する)
SLIは「何を・どのツールで・どのように計測するか」まで書く。「可用性を計測する」では曖昧で、ダッシュボードの設定者によって数値がばらつく。
| 日本語 | 英語 |
|---|---|
| 成功レスポンス率 | Successful response rate |
| p95レイテンシ | p95 (95th percentile) latency |
| エラーレート | Error rate |
| 可用性 | Availability |
| スループット | Throughput |
| 計測期間 | Measurement window |
エラーバジェットの書き方(数字で定義する)
エラーバジェットは「SLO 99.95%」であれば「月間 21.6分のダウンタイムが許容される」と具体的な時間に換算して書く。チームメンバー全員が「今どのくらい余裕があるか」を直感的に把握できる。
| SLO目標 | 月間エラーバジェット |
|---|---|
| 99.9% | 43.8分 |
| 99.95% | 21.6分 |
| 99.99% | 4.4分 |
| 99.999% | 26秒 |
キャパシティ計画との連携は英語キャパシティ計画書の書き方でも参考にしてほしい。
SLOでよく使う英語表現
実務でよく使う英語表現を場面別にまとめた。
SLO・SRE基本用語
| 日本語 | 英語 |
|---|---|
| サービスレベル目標 | SLO (Service Level Objective) |
| サービスレベル指標 | SLI (Service Level Indicator) |
| エラーバジェット | Error Budget |
| 可用性 | Availability |
| 信頼性 | Reliability |
| エラーバジェット消費率 | Error Budget Burn Rate |
| 計測ウィンドウ | Measurement Window |
| バジェット凍結 | Budget Freeze / Feature Freeze |
| ページング | PagerDuty Alert / On-call Page |
SLOレビューミーティングのフレーズ
| 日本語 | 英語 |
|---|---|
| 今月のSLO達成率は? | What’s our SLO compliance this month? |
| エラーバジェットの消費率は〇〇%です | We’ve burned X% of our error budget. |
| バジェットを超過しました | We’ve exhausted the error budget. |
| 機能リリースを一時停止します | We’re freezing feature releases. |
| SLO目標値を見直しませんか | Should we revisit the SLO target? |
| 次のレビューまでに改善します | We’ll improve this before the next review. |
インフラ構成との連携は英語インフラ構成書の書き方でも確認してほしい。
まとめ:英語SLOは5つのセクションで完成する
英語SLOに必要な構成要素を整理した。
- SLIは「何を・どのツールで・どのように計測するか」まで具体的に定義する
- SLO目標値はSLAより厳しく設定し、違反前に検知できるバッファを持たせる
- エラーバジェットは時間(分)に換算して書き、チーム全員が直感的に把握できるようにする
- エラーバジェットポリシーで「消費率が〇%を超えたら何をするか」を事前に定義する
テンプレートをコピーして、まずSLI定義から書き始めてほしい。「何を計測するか」が決まれば、SLO目標値とエラーバジェットは自然に定まる。


コメント