SRE 必修課:一次搞懂 SLI、SLO、SLA 差異,Google DevOps 理念實踐

說到確保應用程式的可用性,建立並監控服務層指標十分重要,而這也是 Google 網站可靠性工程 (Site Reliability Engineering, SRE) 團隊在 Google 的日常,他們 SRE 的基礎原則就是改善服務,進而優化使用者體驗。

SRE 的概念要從「測量指標應與商業目標密切相關」的這個想法開始,除了事業層級的服務水準合約 (SLA),在 SRE 的規畫實踐中,也會使用 SLO 與 SLI。接下來,我們就透過這篇文章帶您了解這三者的差異,幫助您了解 Google Cloud 的 SLI、SLO、SLA 是如何定義,而您又該如何著手制定適合您的指標 閱讀全文〈SRE 必修課:一次搞懂 SLI、SLO、SLA 差異,Google DevOps 理念實踐〉

【手把手教學】延長Cloud Monitoring自定義指標和Prometheus指標的保留期

監控指標可幫助您了解業務和應用程式的效能。指標如果有更長的保留時間,就可以進行年度或季度的分析和報告,預測季節性趨勢,並符合法規的保留政策等等。Google 日前宣布 Cloud Monitoring 可以延長保留自定義指標和 Prometheus 指標,保留從到 6 周延長至 24 個月。預設情況下,將啟用自定義指標和 Prometheus 指標的延長保留時間。

更長的保留時間在金融業、零售業、醫療保健產業和媒體公司中特別有用。例如,財務團隊可以使用長時間的數據來預測季節性趨勢,以便您知道在黑色星期五等購物節之前,要預留多少 Compute Engine 資源,DevOps 團隊也可以使用年度數據來規劃特定節日的流量擴展。 閱讀全文〈【手把手教學】延長Cloud Monitoring自定義指標和Prometheus指標的保留期〉

開發人員小訣竅!簡化、加速你的 Google Kubernetes Engine 開發

當工程師考慮是否要在 Kubernetes 這個容器管理平台進行部署時,關鍵的決定因素通常是 Kubernetes 在維運方面的優勢:更好的資源效率、更高的可擴展性、高彈性與安全性等等。

但事實上,除了維運之外,Kubernetes 也有利於公司的軟體開發;無論是提高程式碼的可攜性、提高生產率,這些因素都讓 Kubernetes 成為許多開發單位的首選。

正如 Gooogle Cloud 在 Re-architecting to cloud native: an evolutionary approach to increasing developer productivity at scale 一文中所提出的論點: Kubernetes 是一種提高開發人員生產力的革命性技術,它讓你能更輕易地開始使用現代的雲原生軟體開發模式(如微服務),帶給你諸多好處,包括:

閱讀全文〈開發人員小訣竅!簡化、加速你的 Google Kubernetes Engine 開發〉