開發人員平台和應用程式的作業

Last reviewed 2024-12-13 UTC

您必須持續執行多項不同的管理工作,才能運作開發人員平台和容器化應用程式。這類工作包括從範本建立新應用程式、授權新開發人員群組使用開發人員平台、規劃容量需求,以及偵錯執行階段問題。

作業可自動執行,也可以手動執行。

常見的自動化作業

此範本可透過 webhook 觸發事件 (一種簡單的 API 類型) 自動執行一些最常見的工作。觸發事件會自動連結至來自其中一個來源控管存放區的 webhook 事件。開發人員平台開發人員可以連結其他觸發事件。開發人員平台開發人員通常會編寫開發人員入口網站,這可以是簡單的網路表單,在提交表單時會呼叫 Webhook 觸發事件。

下表說明藍圖使用 webhook 觸發條件自動執行的常見工作。工作頻率僅供參考,因為工作頻率取決於多項因素。工作不一定會以精確的間隔重複執行。

工作 使用者 說明 工作頻率

新增用戶群。

開發人員平台管理員

管理員在開發人員入口網站上提交表單。新的租戶表單欄位包括租戶名稱和團隊成員。自動觸發事件會為新租用戶建立資源。

每年幾次

根據現有應用程式範本新增應用程式。

應用程式開發人員

開發人員在開發人員入口網站上提交表單。新的應用程式表單欄位包括租用戶名稱、應用程式名稱和基本應用程式範本。自動觸發條件會為新應用程式建立資源。

每年幾次

將應用程式的原始碼變更建構並部署至開發環境。

應用程式開發人員

開發人員會編輯原始碼、在本機上執行及測試程式碼,然後提交程式碼。藍圖不會參與本機開發人員工作流程,但 Skaffold 工具支援本機建構步驟。

每天為每個應用程式執行幾次

將應用程式的 YAML 設定變更部署至開發環境。例如,您可以透過變更 YAML 設定來增加部署資源的 CPU。

應用程式開發人員

開發人員編輯應用程式設定並提交變更。

每週多次,每個應用程式各一次

將應用程式基礎架構變更部署至開發環境。應用程式基礎架構是應用程式專案中的雲端資源。舉例來說,您可以增加 AlloyDB for PostgreSQL 執行個體的 CPU 數量。

應用程式開發人員

開發人員編輯應用程式資源 Terraform 專案,並提交變更。開發人員在開發人員入口網站上提交表單。自動觸發事件會啟動規劃和套用管道。

每年多次

將應用程式變更從開發環境推送至非正式版 (或從非正式版推送至正式版)。應用程式變更可能包括新的應用程式映像檔或應用程式 YAML 設定變更。

應用程式運算子

運算子會將變更從開發分支版本合併至非正式環境分支版本 (或從非正式環境分支版本合併至正式環境分支版本)。作業員會監督這項作業。

每週多次,每個應用程式各一次

將應用程式基礎架構變更從開發環境推送至非正式環境 (或從非正式環境推送至正式環境)。

應用程式運算子

運算子會將特定變更從開發分支版本合併至非正式環境分支版本 (或從非正式環境分支版本合併至正式環境分支版本)。作業員監督推行作業。

每季針對每個應用程式執行多次

常見的手動操作

某些開發人員平台作業的本質上較不具結構性,且不會使用開發人員平台的自動化功能。您可以根據這個藍圖開發自己的劇本,並在 Google Cloud 控制台中執行這些工作。

下表說明這些非自動化工作。任務頻率僅供參考,因為任務頻率取決於許多因素。工作不一定會以精確的間隔重複執行。

工作 使用者 說明 工作頻率

定義新的應用程式範本。

開發人員平台開發人員

開發人員修改以藍圖範本為基礎的應用程式範本,或將範本移植至新語言。

每年幾次

調查開發環境中的服務執行階段錯誤。

應用程式開發人員

開發人員會使用 Google Cloud 控制台中的「記錄檔探索工具」和「Metrics Explorer」,查看租用戶和應用程式的錯誤記錄、監控指標和時間序列資料。

每月數次

調查正式版或非正式版環境中的服務執行階段錯誤。

應用程式運算子

操作員會使用Google Cloud 主控台中的「記錄檔探索工具」和「指標探索工具」,查看租用戶和應用程式的錯誤記錄、監控指標和時間序列資料。

每月數次

調查建構錯誤。

應用程式開發人員

開發人員會在 Google Cloud 控制台中查看Cloud Build 記錄,包括建構狀態和記錄。

每週數次

調查開發環境中的部署錯誤

應用程式開發人員

開發人員可在 Google Cloud 控制台中查看 Cloud Deploy 發布和推出記錄,瞭解部署作業的成功狀態和記錄,包括任何錯誤。

每月數次

調查非正式環境和正式環境中的部署錯誤

應用程式運算子

作業人員可在 Google Cloud 控制台中查看 Cloud Deploy 版本和推出記錄,瞭解部署作業的成功狀態和記錄,包括錯誤記錄。

每月數次

連線至叢集,以便對 GKE 問題進行偵錯。

開發人員平台管理員

系統管理員會使用 Connect 閘道連線至私人叢集。針對常見問題 (例如未排程的 Pod),管理員可以在 Google Cloud 控制台中查看相關資訊,例如未排程的 Pod

每月數次

規劃容量並降低成本。

開發人員平台管理員

管理員可在Google Cloud 控制台中查看 GKE 資源使用率,並按範圍或命名空間匯總。

已排定為每月週期性工作。

調整、新增或移除節點集區。

開發人員平台管理員

管理員會視需要編輯 IaC,然後重新部署應用程式。

這是為了回應處理能力規劃而完成。

檢查安全防護機制。

開發人員平台管理員

管理員可使用 GKE 安全防護機制資訊主頁檢查是否有安全漏洞,以及是否符合標準。

已排定為每月週期性工作。

升級叢集系統軟體版本 (例如 Kubernetes 版本)。

開發人員平台管理員

管理員可使用 GKE 維護期間和排除項目,只在預定時間內允許升級。管理員會先在開發環境中使用開啟的升級視窗。評估升級作業的健康狀況後,管理員會升級非正式環境,然後再升級正式環境。

每季執行一次。

安裝關鍵的叢集安全性更新。

由 GKE 自動執行。

每年幾次

測試區域容錯移轉。

開發人員平台管理員和應用程式管理員

管理員會視情況排定並手動啟動環境的區域容錯移轉作業。

每年在災難復原演練中進行

新增區域

開發人員平台管理員、開發人員平台開發人員和應用程式管理員

開發人員平台管理員會在新區域中部署其他 GKE 叢集。管理員更新應用程式範本,為相關環境新增部署步驟。應用程式運算子接著會整合變更,新增部署序列以納入新區域。

很少

遷移至新的區域。

開發人員平台管理員、開發人員平台開發人員和應用程式管理員

使用者會按照「新增區域」一節所述,新增新的區域。測試新設定後,使用者會移除舊區域。

很少

後續步驟