跳转到主要内容
服务和应用/推理服务相关接口
PUTInference Service APIs起始版本 5.3.22同步需要认证

部署分布式模型服务

部署分布式模型服务

调试可用性

在线调试

使用当前认证信息和示例参数提交 Mock 请求。

请求参数

请求体字段

  • modelServicesList必填

    模型服务部署信息

  • serviceCreationStrategyString必填

    服务创建策略

  • nameString必填

    资源名称

  • descriptionString

    资源的详细描述

  • systemTagsList

    系统标签

响应状态

200 OK

该 API 成功时返回以下响应结构。

  • successBoolean必填

    操作是否成功

  • errorErrorCode必填

    错误码,操作成功时该字段为null

  • inventoryModelServiceInstanceGroupInventory必填

    模型服务实例组清单

    • uuidString必填

      资源的UUID,唯一标识该资源

    • modelServiceUuidString必填

      模型服务UUID

    • modelUuidString必填

      模型UUID

    • instancesList必填

      模型服务实例列表

    • datasetRefInventoriesList必填

      数据集引用列表

    • statusString必填

      实例组状态

    • modelServiceTypeString必填

      模型服务类型

    • typeString必填

      实例组类型

    • nameString必填

      实例组名称

    • descriptionString必填

      实例组描述

    • yamlString必填

      YAML配置

    • supportMetricsList必填

      支持的指标列表

    • exportPathString必填

      导出路径

    • createDateTimestamp必填

      创建时间

    • lastOpDateTimestamp必填

      最后一次修改时间

请求地址

PUT/zstack/v1/ai/model-services

/zstack/v1/ai/model-services

操作 ID

DeployDistributedModelService

永久链接

请求示例

curl -X PUT 'http://{host}/zstack/v1/ai/model-services' -H 'Authorization: OAuth {sessionUuid}' -H 'Content-Type: application/json;charset=UTF-8' -d '{"modelServices":["<modelServices>"],"serviceCreationStrategy":"<serviceCreationStrategy>","name":"<name>","description":"<description>","systemTags":["<systemTags>"],"userTags":["<userTags>"],"resourceUuid":"<resourceUuid>","tagUuids":["<tagUuids>"]}'

响应示例

200
{ "inventory": { "uuid": "groupUuid", "name": "distributed-model-service", "status": "Running" } }

变更历史

此 API 暂无变更历史记录。

查看全部变更历史