阿里第一颗芯片 含光800问世的意义是什么

发布时间:2019-09-25    文章标签: IT     浏览:1145
在9月25日的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的AI芯片——含光800。阿里巴巴第一颗自研芯片正式问世。在业界标准的ResNet-50测试中,含光800推理性能达到78563IPS,比目前业界最好的AI芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。
张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”
含光为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。在杭州城市大脑的业务测试中,1颗含光800的算力相当于10颗GPU。
含光800性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。
据了解,目前含光800已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。
含光800将通过阿里云对外输出AI算力。基于含光800的AI云服务当天正式上线,相比传统GPU算力,性价比提升100%。
过去半年,平头哥先后发布玄铁910、无剑SoC平台。随着含光800的发布,平头哥端云一体全栈产品系列初步成型,涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。
那我们回过头可以来看看含光800的两个最亮眼的参数指标:1.推理性能78563 IPS,我个人猜测这是裸算力的估计,在日常的使用时由于各种限制大部分AI芯片无法达到理论峰值,性价比超过GPU是肯定的,但是同时也要考虑CUDA的加速以及对各类模型的支持程度。从我看到的文章来看,目前达摩院的城市大脑和拍立淘业务都使用了含光800,均达到了10倍以上的性能提高,不过这个10倍是按照1颗芯片对比1颗芯片来比较的,并且没有提到对比的芯片是哪种型号,其实更合理的比较方式应该按照成本来比较。所以尽管这个性能参数很美,例子也很不错,但是仍需要一段时间的观察,同时大部分开发者也要考虑自身算法迁移到含光的开发成本,一线的算法公司都不会用原始的算法模型,达摩院的算法目前似乎也没有全部迁移到含光上来,所以这个时间会很考验阿里云“软”的开发能力,也就是基于含光的开发生态能有多便捷,这个时间越短,那么对其他芯片的威胁也就越大,这不仅仅是一个硬件质量问题。2.能效,500 IPS/W,这个影响最大的是成本,因为云上的GPU普遍是租赁服务,报价都是会按照7*24小时不间断使用来定价,那么功率的降低会影响租赁的报价,具体影响多少目前我还没看到含光的价格,但是基于自研体系的芯片,我猜测价格会是用户能感知的最大的一个点。从我作为一个云上产品的技术开发角度来看,我会优先评估我的算法迁移到含光上的人力开发周期,然后会评估带来的精度变化和处理能力的变化,哪些情况可以变成弹性扩容来保证我产品在实时性上的竞争力,同时不会很大影响成本控制,如果所有这些评估下来,我的成本可以降低50%以上,我相信我会投入开发资源来做芯片上的迁移,如果真如文章所说,性价比提高是100%,并且不影响产品的相关精度,那我相信大部分的产品都会转而使用含光的。正如阿里云的CEO行癫所说,含光800的发布只是万里长征第一步,目前至少这个出发的时间和方向看起来都很正确,后面的难点就是如何能把这长征路上的每一步都走好走踏实了,全自有供应链的云服务是很艰难的选择,但是也是未来不得不布局的选择。阿里云终于迈出了这艰难的一步...


本文链接:https://www.u1e.cn/tweet/11536 [复制]
还没有人回应过