使用预留

如果您有 TPU 预留,则可以使用预留的资源来创建与预留属性匹配的 TPU。此操作称为“使用预留”。如需了解在使用 GKE 时如何使用 TPU 预留,请参阅 GKE 文档中的 TPU 预留

使用特定预留

使用 gcloud alpha compute tpus queued-resources create 命令创建资源时,请使用 --reservation 标志指定要使用的预留的名称。对于在日历模式下创建的未来预留,您还必须将 --provisioning-model 标志设置为 reservation-bound

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reservation=RESERVATION_URL \
    --provisioning-model=reservation-bound # Only required for calendar mode

替换以下占位符变量:

  • QUEUED_RESOURCE_ID:用户为已排队的资源请求分配的 ID。
  • TPU_NAME:用户分配的 TPU ID(名称),该 ID 是在分配已排队的资源请求时创建的。
  • ZONE:要在其中创建 TPU 虚拟机的可用区。如需详细了解支持的可用区,请参阅区域和可用区
  • ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本
  • SOFTWARE_VERSION:Cloud TPU 软件版本
  • RESERVATION_URL:预留的网址。请指定以下某个值:
    • 如果预留属于您的项目:RESERVATION_NAME
    • 如果预留属于其他项目,并且您的项目可以使用该预留:projects/OWNER_PROJECT_ID/reservations/RESERVATION_NAME

使用任何匹配的预留

您可以使用 --reserved 标志根据加速器类型、项目 ID 和可用区自动确定要使用的预留。

CreateNode

如需使用 CreateNode API 消耗任何匹配的预留,请将 gcloud alpha compute tpus tpu-vm create 命令--reserved 标志搭配使用:

gcloud alpha compute tpus tpu-vm create TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --version=SOFTWARE_VERSION \
    --reserved

替换以下占位符变量:

  • TPU_NAME:TPU 的名称。
  • ZONE:要创建 TPU 虚拟机的可用区,该可用区必须与预留可用区一致。
  • ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本
  • SOFTWARE_VERSION:Cloud TPU 软件版本

已排队的资源

如需使用排队资源来消耗任何匹配的预留,请将 gcloud alpha compute tpus queued-resources create 命令--reserved 标志结合使用:

gcloud alpha compute tpus queued-resources create QUEUED_RESOURCE_ID \
    --node-id=TPU_NAME \
    --zone=ZONE \
    --accelerator-type=ACCELERATOR_TYPE \
    --runtime-version=SOFTWARE_VERSION \
    --reserved

替换以下占位符变量:

  • QUEUED_RESOURCE_ID:用户为已排队的资源请求分配的 ID。
  • TPU_NAME:用户分配的 TPU ID(名称),该 ID 是在分配已排队的资源请求时创建的。
  • ZONE:要用于创建 TPU 虚拟机的可用区,也是预留所在的可用区。
  • ACCELERATOR_TYPE:指定要创建的 Cloud TPU 的版本和大小。如需详细了解每个 TPU 版本支持的加速器类型,请参阅 TPU 版本
  • SOFTWARE_VERSION:Cloud TPU 软件版本

查看预留使用情况

您只能通过共享预留的所有者项目查看其使用情况。如果您位于使用方项目中,则必须切换到所有者项目才能查看预留使用情况。

如需查看预留的使用情况,请使用 gcloud compute reservations describe 命令

gcloud compute reservations describe RESERVATION_NAME \
    --project=PROJECT_ID --zone=ZONE

替换以下占位符变量:

  • RESERVATION_NAME:预留的名称。
  • PROJECT_ID:包含预留的项目的 ID。
  • ZONE:预留所在的可用区。

如需列出项目中的所有预留,请使用 gcloud compute reservations list 命令

gcloud compute reservations list --project=PROJECT_ID

替换以下占位符变量:

  • PROJECT_ID:项目的 ID。

后续步骤