Skip to content
On this page

GA ( General Availability ) ( 正式發布)

意思是:產品或功能已經從 Preview / Beta 階段畢業,正式對外開放給所有使用者使用,並且可以在正式環境中穩定使用。

p95

常用在系統效能指標(Latency / Response Time)。

✅ 意思

如果 API 的 p95 = 300ms 代表:

95% 的請求都在 300ms 內完成 只有 5% 比 300ms 慢


🔹 為什麼不用平均值?

假設:

請求時間
100ms
120ms
110ms
105ms
5000ms

平均值會被 5000ms 拉高, 但大部分用戶其實都很快。

所以在高併發系統中通常看:

  • p50(中位數)
  • p95
  • p99

🔹 在真實系統中的用法

在像:

  • Elasticsearch
  • Kibana
  • Prometheus
  • Grafana

你會看到:

API latency p95 = 280ms
API latency p99 = 900ms

p99 代表尾延遲(Tail Latency)。


🔹 架構觀念(給你)

如果:

  • p50 很快
  • p95 很慢
  • p99 更慢

👉 通常表示:

  • GC stop-the-world
  • Lock contention
  • DB slow query
  • Thread pool starvation
  • I/O blocking

你在做分散式系統或 ELK 整合時, p95 是很重要的 SLO 指標。