Appearance
GA ( General Availability ) ( 正式發布)
意思是:產品或功能已經從 Preview / Beta 階段畢業,正式對外開放給所有使用者使用,並且可以在正式環境中穩定使用。
p95
常用在系統效能指標(Latency / Response Time)。
✅ 意思
如果 API 的 p95 = 300ms 代表:
95% 的請求都在 300ms 內完成 只有 5% 比 300ms 慢
🔹 為什麼不用平均值?
假設:
| 請求時間 |
|---|
| 100ms |
| 120ms |
| 110ms |
| 105ms |
| 5000ms |
平均值會被 5000ms 拉高, 但大部分用戶其實都很快。
所以在高併發系統中通常看:
- p50(中位數)
- p95
- p99
🔹 在真實系統中的用法
在像:
- Elasticsearch
- Kibana
- Prometheus
- Grafana
你會看到:
API latency p95 = 280ms
API latency p99 = 900ms
p99 代表尾延遲(Tail Latency)。
🔹 架構觀念(給你)
如果:
- p50 很快
- p95 很慢
- p99 更慢
👉 通常表示:
- GC stop-the-world
- Lock contention
- DB slow query
- Thread pool starvation
- I/O blocking
你在做分散式系統或 ELK 整合時, p95 是很重要的 SLO 指標。