咨询专业顾问
关于行业落地应用及技术架构方案,请点击“立即咨询”联系我们的专业团队。
立即咨询
使用gpu云服务器作为分布式推理的计算节点,或元宇宙服务的服务集群,该计算集群需要具备高可用性,且能随着负载的变化动态调整的能力。您只需通过配置弹性伸缩的动态伸缩模式,系统会根据指定指标(比如算力使用率)的阈值自动地增加或减少云服务器的数量;同时,系统还会自动检测云服务器的健康状态,将不健康的实例移除,并启用新实例,确保该集群的高可用性。
可指定多个可用区,在扩容时将负载均衡分布在个可用区,确保高可用
灵活伸缩:可根据指定的监控指标,实时调整计算集群实例的数量
提供健康检查:自动检测实例运行状况,移除不健康实例并启用新实例
无试合作
VIP大客户服务
7*24小时技术服务
业务定制方案