您必須持續執行多項不同的管理工作,才能運作開發人員平台和容器化應用程式。這類工作包括從範本建立新應用程式、授權新開發人員群組使用開發人員平台、規劃容量需求,以及偵錯執行階段問題。
作業可自動執行,也可以手動執行。
常見的自動化作業
此範本可透過 webhook 觸發事件 (一種簡單的 API 類型) 自動執行一些最常見的工作。觸發事件會自動連結至來自其中一個來源控管存放區的 webhook 事件。開發人員平台開發人員可以連結其他觸發事件。開發人員平台開發人員通常會編寫開發人員入口網站,這可以是簡單的網路表單,在提交表單時會呼叫 Webhook 觸發事件。
下表說明藍圖使用 webhook 觸發條件自動執行的常見工作。工作頻率僅供參考,因為工作頻率取決於多項因素。工作不一定會以精確的間隔重複執行。
工作 | 使用者 | 說明 | 工作頻率 |
---|---|---|---|
新增用戶群。 |
開發人員平台管理員 |
管理員在開發人員入口網站上提交表單。新的租戶表單欄位包括租戶名稱和團隊成員。自動觸發事件會為新租用戶建立資源。 |
每年幾次 |
根據現有應用程式範本新增應用程式。 |
應用程式開發人員 |
開發人員在開發人員入口網站上提交表單。新的應用程式表單欄位包括租用戶名稱、應用程式名稱和基本應用程式範本。自動觸發條件會為新應用程式建立資源。 |
每年幾次 |
將應用程式的原始碼變更建構並部署至開發環境。 |
應用程式開發人員 |
開發人員會編輯原始碼、在本機上執行及測試程式碼,然後提交程式碼。藍圖不會參與本機開發人員工作流程,但 Skaffold 工具支援本機建構步驟。 |
每天為每個應用程式執行幾次 |
將應用程式的 YAML 設定變更部署至開發環境。例如,您可以透過變更 YAML 設定來增加部署資源的 CPU。 |
應用程式開發人員 |
開發人員編輯應用程式設定並提交變更。 |
每週多次,每個應用程式各一次 |
將應用程式基礎架構變更部署至開發環境。應用程式基礎架構是應用程式專案中的雲端資源。舉例來說,您可以增加 AlloyDB for PostgreSQL 執行個體的 CPU 數量。 |
應用程式開發人員 |
開發人員編輯應用程式資源 Terraform 專案,並提交變更。開發人員在開發人員入口網站上提交表單。自動觸發事件會啟動規劃和套用管道。 |
每年多次 |
將應用程式變更從開發環境推送至非正式版 (或從非正式版推送至正式版)。應用程式變更可能包括新的應用程式映像檔或應用程式 YAML 設定變更。 |
應用程式運算子 |
運算子會將變更從開發分支版本合併至非正式環境分支版本 (或從非正式環境分支版本合併至正式環境分支版本)。作業員會監督這項作業。 |
每週多次,每個應用程式各一次 |
將應用程式基礎架構變更從開發環境推送至非正式環境 (或從非正式環境推送至正式環境)。 |
應用程式運算子 |
運算子會將特定變更從開發分支版本合併至非正式環境分支版本 (或從非正式環境分支版本合併至正式環境分支版本)。作業員監督推行作業。 |
每季針對每個應用程式執行多次 |
常見的手動操作
某些開發人員平台作業的本質上較不具結構性,且不會使用開發人員平台的自動化功能。您可以根據這個藍圖開發自己的劇本,並在 Google Cloud 控制台中執行這些工作。
下表說明這些非自動化工作。任務頻率僅供參考,因為任務頻率取決於許多因素。工作不一定會以精確的間隔重複執行。
工作 | 使用者 | 說明 | 工作頻率 |
---|---|---|---|
定義新的應用程式範本。 |
開發人員平台開發人員 |
開發人員修改以藍圖範本為基礎的應用程式範本,或將範本移植至新語言。 |
每年幾次 |
調查開發環境中的服務執行階段錯誤。 |
應用程式開發人員 |
開發人員會使用 Google Cloud 控制台中的「記錄檔探索工具」和「Metrics Explorer」,查看租用戶和應用程式的錯誤記錄、監控指標和時間序列資料。 |
每月數次 |
調查正式版或非正式版環境中的服務執行階段錯誤。 |
應用程式運算子 |
操作員會使用Google Cloud 主控台中的「記錄檔探索工具」和「指標探索工具」,查看租用戶和應用程式的錯誤記錄、監控指標和時間序列資料。 |
每月數次 |
調查建構錯誤。 |
應用程式開發人員 |
開發人員會在 Google Cloud 控制台中查看Cloud Build 記錄,包括建構狀態和記錄。 |
每週數次 |
調查開發環境中的部署錯誤 |
應用程式開發人員 |
開發人員可在 Google Cloud 控制台中查看 Cloud Deploy 發布和推出記錄,瞭解部署作業的成功狀態和記錄,包括任何錯誤。 |
每月數次 |
調查非正式環境和正式環境中的部署錯誤 |
應用程式運算子 |
作業人員可在 Google Cloud 控制台中查看 Cloud Deploy 版本和推出記錄,瞭解部署作業的成功狀態和記錄,包括錯誤記錄。 |
每月數次 |
連線至叢集,以便對 GKE 問題進行偵錯。 |
開發人員平台管理員 |
系統管理員會使用 Connect 閘道連線至私人叢集。針對常見問題 (例如未排程的 Pod),管理員可以在 Google Cloud 控制台中查看相關資訊,例如未排程的 Pod。 |
每月數次 |
規劃容量並降低成本。 |
開發人員平台管理員 |
管理員可在Google Cloud 控制台中查看 GKE 資源使用率,並按範圍或命名空間匯總。 |
已排定為每月週期性工作。 |
調整、新增或移除節點集區。 |
開發人員平台管理員 |
管理員會視需要編輯 IaC,然後重新部署應用程式。 |
這是為了回應處理能力規劃而完成。 |
檢查安全防護機制。 |
開發人員平台管理員 |
管理員可使用 GKE 安全防護機制資訊主頁檢查是否有安全漏洞,以及是否符合標準。 |
已排定為每月週期性工作。 |
升級叢集系統軟體版本 (例如 Kubernetes 版本)。 |
開發人員平台管理員 |
管理員可使用 GKE 維護期間和排除項目,只在預定時間內允許升級。管理員會先在開發環境中使用開啟的升級視窗。評估升級作業的健康狀況後,管理員會升級非正式環境,然後再升級正式環境。 |
每季執行一次。 |
安裝關鍵的叢集安全性更新。 |
無 |
由 GKE 自動執行。 |
每年幾次 |
測試區域容錯移轉。 |
開發人員平台管理員和應用程式管理員 |
管理員會視情況排定並手動啟動環境的區域容錯移轉作業。 |
每年在災難復原演練中進行 |
新增區域。 |
開發人員平台管理員、開發人員平台開發人員和應用程式管理員 |
開發人員平台管理員會在新區域中部署其他 GKE 叢集。管理員更新應用程式範本,為相關環境新增部署步驟。應用程式運算子接著會整合變更,新增部署序列以納入新區域。 |
很少 |
遷移至新的區域。 |
開發人員平台管理員、開發人員平台開發人員和應用程式管理員 |
使用者會按照「新增區域」一節所述,新增新的區域。測試新設定後,使用者會移除舊區域。 |
很少 |
後續步驟
- 請參閱這份系列文章的下一篇說明文件,瞭解如何管理開發人員平台的成本和歸因。