本篇文章1102字,读完约3分钟

阿里巴巴使用人工智能来分配数据中心资源,节省了多达一半的服务器 11月6日,阿里巴巴数据中心人工智能调度员“宠儿”正式上任。在实习期间,达林打破了人类工程师的许多记录:数据中心资源的分配率提高到90%以上,一些企业节省了一半的服务器,异常机器可以在2秒钟内锁定,命中率达到94%。 为了在双十一期间有更多的时间买入,阿里巴巴工程师开发了一个人工智能来解放自己。

阿里巴巴使用人工智能来分配数据中心资源,节省了多达一半的服务器

11月6日,阿里巴巴人工智能调度官达林正式上任。在实习期间,达林打破了人类工程师的许多记录:数据中心资源的分配率提高到90%以上,一些企业节省了一半的服务器,异常机器可以在2秒钟内锁定,命中率达到94%。

随着双11的规模逐年飙升,管理和调度成千上万的服务器不再适合人们去做。阿里巴巴高级搜索和开发专家郑南表示,达林的算法可以快速给出计算资源的最佳部署方案,并根据访问量不断移动应用和数据,以确保没有机器偷懒。

今年,工程师的职责变成了如何向达林提供数据。郑南说,我们所要做的就是提供诸如表数据大小、应用历史访问和当前部署计划等信息。我们只能边喝茶边看她的表演。她甚至可以在网上克隆一项真正的服务,并进行压力测试,以确定该方案是否最优。

除了计算资源的连续调度和应用程序的连续处理之外,Darling还有另一个职责,即及时发现异常机器并快速隔离它们。你知道,双11期间机器的异常可能会导致数百万用户的订单失败。

然而,对于工程师来说,从机器出现异常并被发现到过程完成,整个过程有时需要几分钟。这是人类所能做到的极限。Darling可以通过数据算法将时间、负载、服务状态等不确定因素关联起来,最终快速锁定异常机器。

在日常工作中,达林每天收集29亿台机器,并每天隔离异常机器约1000次。高峰时段调度准确率达到94%,时间仅为2秒。

阿里巴巴iDST团队是达林的创造者。项目负责人朱生火博士表示,达林的工作首先是在集群监控数据的基础上,建立多种深度学习和在线学习模型,了解集群中每台机器和应用的当前和未来状态。在此基础上,Darling可以在复杂的环境中自主学习和判断,并通过应用强化学习、组合优化等技术做出一系列的智能决策,如错峰排列、规则碎片等,从而全局优化集群的资源分配率和稳定性。

阿里巴巴使用人工智能来分配数据中心资源,节省了多达一半的服务器

除了达林,一系列新物种,如机器操作员、机器商店向导、智能客户服务、人工智能设计师、机器采摘工和机房巡逻员都在天猫双十一前夕开始工作。

2020-02-29 21:22:12 国际信息公司谷歌今年将在其美国办公室和数据中心投资100亿美元。 谷歌宣布了2020年的扩张计划,计划在11个州投资100多亿美元建设办公室和数据中心,包括加州、科罗拉多州和乔治亚州。

标题:阿里巴巴使用人工智能来分配数据中心资源,节省了多达一半的服务器

地址:http://www.og5o.com/ppzx/4385.html