SLIとは

SLIは、顧客に対して提供するサービスの品質や性能を客観的かつ定量的に測定するために選択された、具体的な指標のことです。

SLIの概要とサービス品質管理の基盤

SLI(Service Level Indicator、サービスレベル指標)は、サービスの信頼性工学(Site Reliability Engineering, SRE)およびサービスレベル管理(Service Level Management, SLM)における最も基本的な要素です。これは、主観的で曖昧になりがちな「サービスの良さ」を、誰もが合意できる具体的な数値で表現する役割を果たします。

SLIの選定は、サービスのユーザーエクスペリエンス(UX)に直結するクリティカルな側面に焦点を当てる必要があります。単に監視が容易な指標を選ぶのではなく、ユーザーが不満を感じる瞬間に強く相関する指標を選ぶことが重要です。不適切なSLIを設定すると、指標上は良好でも、ユーザー体験が悪いという乖離が発生する可能性があります。

主な目的は、サービスの信頼性を客観的に評価し、その後の目標設定(SLO)と顧客との合意(SLA)の基礎となる測定可能なデータを提供することです。

SLIの主要なカテゴリと具体例

SLIはサービスの性質によって異なりますが、一般的に以下の4つの主要なカテゴリに分類されます。

1. レイテンシ(Latency、応答時間)

  • 定義: サービスがリクエストを受信してから、適切な応答を返すまでにかかる時間。
  • 種類:
    • フロントエンドレイテンシ: ユーザーのブラウザでのレンダリング時間など、クライアント側での遅延。
    • バックエンドレイテンシ: サーバーがリクエストを処理するのにかかる時間。
  • 測定の重要性: 平均値ではなく、パーセンタイル値(例:90パーセンタイル、99パーセンタイル)で測定することが極めて重要です。平均値は少数の遅延リクエスト(ロングテール)の影響を隠蔽してしまうため、99パーセンタイル値(全リクエストのうち99%がこの時間内に応答した)をSLIとすることで、最悪の顧客体験を改善する動機付けとなります。

2. エラー率(Error Rate)

  • 定義: 全リクエストまたはトランザクションのうち、失敗した、あるいは正しく処理されなかったものの割合。
  • 種類: サーバー側エラー(HTTP 5xxエラー)、クライアント側エラー(HTTP 4xxエラー)、または特定のビジネスロジックエラー(例:決済失敗)などがあります。
  • 計算式:

\text{Error Rate} = \frac{\text{Number of Failed Requests}}{\text{Total Number of Valid Requests}}

3. 可用性(Availability)

  • 定義: サービスが正常に動作し、ユーザーが利用可能であった時間の割合。
  • 測定の重要性:
    • システム全体のダウンタイムを計測する最も一般的な指標であり、SLOやSLAの基礎となります。
    • 可用性は通常、小数点以下の「ナイン」(例:99.9%を「スリーナイン」)で表現されます。

4. スループット(Throughput)

  • 定義: 単位時間あたりにシステムが正常に処理できるリクエストまたはデータ量の総計。
  • 重要性: システムのキャパシティ(処理能力)や、ボトルネックの有無を評価するために使用されます。レイテンシと密接に関連しており、レイテンシが悪化せずにスループットが維持できている状態が望ましいとされます。

適切なSLIの選択と運用

優れたSLIは、以下の特性を持つべきです。

  1. 測定可能性(Measurable): 自動化されたツールやログ分析によって、常に正確に計測できること。
  2. 理解可能性(Understandable): チームメンバー全員が、その指標が何を意味し、なぜ重要なのかを明確に理解できること。
  3. 相関性(Correlatable): 顧客体験の良し悪しと直接的に結びついていること。

SLIは、SLOを設定する上での出発点であり、サービス品質の継続的な改善サイクル(計測 → 目標設定 → 改善)の起点となります。

関連用語

レイテンシ | 今更聞けないIT用語集
スループット | 今更聞けないIT用語集
クラウドソリューション

お問い合わせ

システム開発・アプリ開発に関するご相談がございましたら、APPSWINGBYまでお気軽にご連絡ください。

APPSWINGBYの

ソリューション

APPSWINGBYのセキュリティサービスについて、詳しくは以下のメニューからお進みください。

システム開発

既存事業のDXによる新規開発、既存業務システムの引継ぎ・機能追加、表計算ソフトによる管理からの卒業等々、様々なWebシステムの開発を行っています。

iOS/Androidアプリ開発

既存事業のDXによるアプリの新規開発から既存アプリの改修・機能追加まで様々なアプリ開発における様々な課題・問題を解決しています。


リファクタリング

他のベンダーが開発したウェブサービスやアプリの不具合改修やソースコードの最適化、また、クラウド移行によってランニングコストが大幅にあがってしまったシステムのリアーキテクチャなどの行っています。