单可用区预配吞吐量

借助单可用区预配吞吐量功能,您可以在仅有一个可用区的特定区域预留吞吐量。此选项可为需要进行机器学习处理的应用场景中的 Gemini 模型提供可预测的性能。

如需查看支持的模型及区域的列表,请参阅部署和端点。如需查看支持机器学习处理的区域及模型的列表,请参阅机器学习处理

单可用区预配吞吐量功能的特性

本部分概述了单可用区预配吞吐量功能的主要特性:

  • 价格及计量单位与标准预配吞吐量保持一致:单可用区预配吞吐量使用与标准预配吞吐量相同的吞吐量计量单位 (GSU)、价格和条款。

  • 单可用区预配吞吐量支持区域内机器学习处理:所有请求都在购买区域内处理,包括超出所购买吞吐量金额部分的流量。此部分流量将使用相应区域中的缓冲容量,按随用随付费率计费。

  • 您可以控制超额流量:您可以像使用标准预配吞吐量一样,用相同的标头控制溢出流量

  • 您可以监控订单:您可以使用现有的预配吞吐量监控功能来监控单可用区预配吞吐量订单。

限制

单可用区预配吞吐量存在以下局限性:

购买单可用区预配吞吐量

如需获得购买单可用区预配吞吐量方面的帮助,请与您的 Google Cloud 客户代表联系

后续步骤