为期两(liǎng)天的(de) AICon 全球人工智(zhì)能与机器(qì)学习技术大会已落下帷幕,作为一场(chǎng)面(miàn)向各行(háng)业 AI 中高(gāo)层技术(shù)人员(yuán)的盛会,历年(nián) AICon 都吸引了业界(jiè)顶级公司参与其(qí)中(zhōng),今年也不例外,包括华(huá)为、AWS、阿里(lǐ)巴(bā)巴(bā)、腾讯等公司的 AI 专家们齐聚一堂,共同探讨围绕 AI 的产业(yè)变革机会与技术(shù)创新方向。
这场大会上所(suǒ)展示的(de) AI 落地案(àn)例、AI 技术(shù)实(shí)践(jiàn)以(yǐ)及 AI 的工业化应用,都在(zài)强(qiáng)调一个事实:站在(zài) 2019 年 11 月(yuè)的时(shí)间点去看(kàn),AI 之于各个行业的意义已经(jīng)不再是「是否有价值」,而是变成了「如何让 AI 变得更有价值(zhí)」。
与(yǔ)此同(tóng)时,在 5G 商用(yòng)元年,全新通讯技(jì)术带来的巨大潜(qián)力(lì),正在传递到产(chǎn)业的各个链条,而云(yún)计算的持续(xù)进化,已经深刻影响到了(le)从政府到大型企业的方方面(miàn)面(miàn)。
这也留给(gěi)行业一(yī)个命题:当 5G、AI 与云共同定义(yì)了这个时代(dài),各个行业应(yīng)用 AI 的第一步从哪里开始?
参与这场(chǎng)大(dà)会的华(huá)为云给出(chū)了自己的一(yī)个回答:利用华为(wéi)云的全(quán)栈全场景 AI 能力,开发者、企业可以(yǐ)快速驶入 AI 开发、部署(shǔ)与应用的赛道。
portant;" />
据了(le)解,此次(cì)大会上,华为云进一步展示了其(qí)全(quán)栈全场景的 AI 解决方案。具体(tǐ)来说,「全(quán)栈」指的是包(bāo)括芯片、芯片使能、训练和推理框架(jià)和(hé)应用(yòng)使能在内的(de)全堆(duī)栈方案(àn);「全(quán)场景」则是将公有云、私有云(yún)、各种边缘计算、物联网(wǎng)行业终端以及消费(fèi)类终端在内的(de)全场(chǎng)景纳(nà)入到 AI 的部署(shǔ)环境中。
那么,如何进一步理(lǐ)解(jiě)当下(xià) AI 开(kāi)发、部署的(de)痛(tòng)点,华为云(yún)全栈全(quán)场景的 AI 能(néng)力(lì),又对开发者、企业有何意义(yì)?
接下来(lái),我们来一一解读。
1.AI 开发/部署所面临的(de)挑战(zhàn)
对于任何一(yī)个行业来说,AI 开发、部署都是一个全新(xīn)的挑战,而且这(zhè)些挑战也贯穿在 AI 开发、部(bù)署的始终。
首(shǒu)先,AI 算力需求旺盛且多样(yàng)化。自 2012 年以(yǐ)来,AI 计算能(néng)力需求早已超过摩尔定律(lǜ),当模(mó)型(xíng)越发复杂(zá),当(dāng)算(suàn)力需求越来越大,开发者、企业所面临的计算成本也在大幅上(shàng)升。
另一方面,随着物联网以及(jí)即将到来的 5G 时代,AI 计算的场景也将变得多(duō)元化,从大型数据(jù)中心(xīn)到(dào)迷你终端(duān)设备(bèi),不同场景(jǐng)下的计算需(xū)求、功耗(hào)成本以及计算延时也(yě)有着不同的(de)需求(qiú)。
portant;" />
这意味着,AI 开发者和企业需要(yào)强大、灵活以及多场景的算力。
其次,AI 框架(jià)与一站式 AI 平台的需求。作(zuò)为向下对接芯片、向上承载应用的 AI 框(kuàng)架,业界目前(qián)流行的 TensorFlow 等,多为(wéi)美国公司研发并开源出来的产品,且不说会不会受到国(guó)际大环境的影响,只谈开源产品的本地化(huà)后续服务,TensorFlow 等都(dōu)很难(nán)直接适应中国开发(fā)者(zhě)的(de)需(xū)求。
而面对 AI 人才(cái)短缺的现实(shí),如何进一(yī)步降低 AI 开发门槛成为行业的迫(pò)切需求,更进一步,开发(fā)者和企业也需(xū)要一站式的 AI 开发环(huán)境,从(cóng)而快速完成从数(shù)据标注到(dào)模型部署的一整套工作流程。
第三,云、边(biān)、端的训练和部署如何协同。这(zhè)是一个摆在全行业(yè)面(miàn)前的共同挑战, 相比于 AI 模型训练为数不多的技术选型(xíng)(GPU,数据中心),AI 模型部署对于开发者、企业而言更复杂。这(zhè)是因为,AI 部(bù)署所面临的是纷繁复杂(zá)的设(shè)备环境,特别是在(zài)移动(dòng)设(shè)备、边(biān)缘设备交织(zhī)的业务场景里,如何高效完(wán)成模型从快(kuài)速(sù)训练到快速部署,成为各(gè)行各(gè)业 AI 从业者关注的命题。
2.华为云如何破解算力难题?
在 ICT 领域耕耘多年的华为,面对 AI 领域开发、部(bù)署的(de)难(nán)点、痛点,提出了自己的一番思考(kǎo)。
正如上文所言,AI 计算需求在(zài)过去(qù)七(qī)年里迎来大爆发(fā),根据 OpenAI 的统计(jì),自(zì) 2012 年至今,AI 算(suàn)力(lì)需求增长了 30 万(wàn)倍。
portant;" />
这带(dài)来(lái)两个显(xiǎn)著(zhe)变化:其一,传(chuán)统的 CPU 已经无(wú)法承(chéng)担起 AI 计算的需求;其(qí)二,业界(jiè)对于 GPU、FPGA 与(yǔ) NPU 的需求开始上升。
这(zhè)正是华为昇腾芯片出现的(de)行业背景。通过底(dǐ)层创新性的(de)「达芬奇架构」,使得华为昇腾芯片具备了在端边云上拥有统一的(de)计算架构,由此带来了不仅(jǐn)是计算能力的大幅提升,而且还可以实现算(suàn)法一次开发,再顺利迁移(yí)到其他场景的芯片上的(de)能力(lì)。
portant;" />
以今年正式发布的(de)的昇腾 910 芯片为例,其主要面向数据中心的云端(duān)AI训练,半精(jīng)度 (FP16)算力(lì)达到256 Tera-FLOPS,整数精(jīng)度 (INT8) 算力达到512 Tera-OPS,达到(dào)规格算力所需功耗仅310W,无(wú)论(lùn)计(jì)算(suàn)能力还是功(gōng)耗,都属(shǔ)业(yè)界领先(xiān)水平。
与此同时,基于「达芬奇架构」,华为在端、边、云都已推出了相应芯片,这些芯片构(gòu)成(chéng)了华为 AI 能力的最底层:芯片层/利用华为云的(de)调度能力,满足开(kāi)发者、企业不(bú)同场景中(zhōng)的计算需求,而公有(yǒu)云「用多少付多少钱」的商业(yè)模式,可以大(dà)幅(fú)降低企(qǐ)业的(de) AI 计算成(chéng)本。
3.从框架到(dào)一(yī)站(zhàn)式开发平台的赋能
在 AI 开发流程里(lǐ),华为将 MindSpore 作为统一训(xùn)练(liàn)和推理的(de)开源框架。MindSpore 从设计开始(shǐ),就确(què)定了「AI 算法即代码」的设计范式,可以大幅降低 AI 开发门(mén)槛;而在执行模式(shì)中,基于(yú) Ascend Native 的执(zhí)行引擎,能够充分发挥(huī)昇腾芯片的强大算力;与此同时,MindSpore 还具备了适配端、边、云的能(néng)力,在统一架构的(de)基础上,根据场(chǎng)景不同(tóng)可大可小,最大限度满足企业(yè)场景需求,并提(tí)供(gòng)更好的资源效(xiào)率和(hé)隐(yǐn)私保护。
portant;" />
值得一提的(de)是,MindSpore 未来也(yě)将全面(miàn)开(kāi)源(yuán),不同行业的(de)开发(fā)者,完(wán)全可(kě)以根据其自身业务需求,灵(líng)活(huó)扩展和定制,将其应用到更(gèng)多(duō)硬件平台之上,构建自(zì)己的 AI 训练模型。
在(zài)开(kāi)源框架 MindSpore 之上,华为还拥有一(yī)站(zhàn)式 AI 开(kāi)发平台 ModelArts,这个平台所肩(jiān)负的,是如(rú)何为开发者/企(qǐ)业提供一整套基于云端的机器学习开发全流程(chéng)服务。
portant;" />
2019 年 3 月份(fèn),ModelArts 在 AI 权威竞赛斯坦(tǎn)福大学(xué) DAWNBench 榜单中取得图像识(shí)别训(xùn)练和(hé)推理性能双料冠军,将模型训练时间(jiān)大幅缩减的同(tóng)时实现了超强推(tuī)理性能。
portant;" />
来看一组具(jù)体数字,在训练性能(néng)方(fāng)面(miàn),ResNet50_on_ImageNet上的测试结果显示,当采用128块V100时,华为云ModelArts上模型训练时间仅需4分08秒,与 2018年12月创下的9分(fèn)22秒纪录(lù)相比(bǐ)又快了一(yī)倍,比此(cǐ)前 fast.ai 在 AWS 平台上的训练速度快4倍;在推理性能方面(miàn),华为云(yún)ModelArts识别(bié)图片(piàn)的速度是排名(míng)第二厂商的1.7倍、亚(yà)马(mǎ)逊(xùn)的 4 倍以及 Google 的 9.1倍。
ModelArts 能取得这样的(de)成绩,展现(xiàn)了其(qí)在机器学(xué)习平台(tái)的技术优化能力,通过技(jì)术创(chuàng)新降(jiàng)低机器学习平台(tái)的使用成本,最终(zhōng)将(jiāng)技术红(hóng)利让给(gěi)企业和开发者。
值得(dé)一(yī)提的是,华为云 ModelArts 也践(jiàn)行了华为公司「把复杂留给自己,把简单带个客户」的(de)理念,内置了自动(机器)学习特性(xìng),通过算法(fǎ)实(shí)现(xiàn)模型(xíng)训练的参数自动(dòng)化选择和模型自动调(diào)优,让零 AI 基础(chǔ)的业(yè)务开发者(zhě)快速完成模型的训练和(hé)部署,甚至在一些场(chǎng)景中可以(yǐ)实现零(líng)代码(mǎ)开发 AI 模型。
比如(rú)在(zài)机器学习最耗时耗力的数据标(biāo)注中(zhōng),ModelArts 通过内置 AI 数据(jù)框架,以 AI 机制(zhì)来治理(lǐ)数据,再通过(guò)迭代训练解决标注的数据量问题,这在数据量(liàng)较(jiào)大(dà)的场景中(zhōng)可百倍提升(shēng)数据标注效率。
再(zài)比如针对 AI 开发全流(liú)程管(guǎn)理,ModelArts 内置了可(kě)视化(huà)管理(lǐ)模(mó)块,可以(yǐ)帮(bāng)助开发者快速了解模型训(xùn)练的进展,ModelArts 提供了从(cóng)数据、算法、训练、模(mó)型(xíng)、服务全流程可(kě)视(shì)化管理,通过(guò)任意一个对象查看这个(gè)流(liú)程,真正做到了工作流(liú)的可(kě)视化。
值得一提的是,在技术创新到产品全(quán)流程思考之外,ModelArts 还在(zài)生态使能上有自己(jǐ)的思考(kǎo)。AI 市场就(jiù)是其中(zhōng)一例(lì),这是(shì)一(yī)个(gè)基于(yú) ModelArts 构(gòu)建(jiàn)的开发(fā)者生态社区,提供了 AI 模型、API 交易、数据、竞(jìng)赛案例等内(nèi)容共享功能。
在这(zhè)个市场,不管是(shì)科研机构还是 AI 应(yīng)用开发商、解(jiě)决方案集成商,抑(yì)或是不同行业不同(tóng)类型的企业,都可以(yǐ)快速找到符合自(zì)身需(xū)求的技术或商业机会,有效连接 AI 开发(fā)生态链(liàn)各(gè)参(cān)与方(fāng),加速 AI 产(chǎn)品的开发与落地,也保障了 AI 开发生态链上各个(gè)参与(yǔ)方的商业(yè)利(lì)益。
4. 高(gāo)效(xiào)可信(xìn)的云(yún)端(duān) AI 开(kāi)发(fā)环(huán)境
如何将芯片带(dài)来的(de)计(jì)算能力与框架/平台释放的场景(jǐng)能力(lì)更便捷地(dì)交付(fù)给开发者,华为还为 AI 开发准备了一(yī)整套基于 CloudIDE 与 CodeHub 的高(gāo)效可信开发环境。
portant;" />
首先,CloudIDE 定义(yì)了一(yī)种全新的(de)在线编程体验(yàn),开(kāi)发者(zhě)只需(xū)通(tōng)过浏览器即可访问云端集成的(de)开发(fā)环境,无(wú)须担心安装(zhuāng)过(guò)多软件所(suǒ)带来的本地资(zī)源消耗;其内置了主流技术栈、支持 100 +语言的语(yǔ)法高亮,同时还能在线调试与在(zài)线运(yùn)行;而利用云端按(àn)需获取(qǔ)的方式,开发(fā)者(zhě)可(kě)以灵活配置开发所需的(de)计(jì)算与存储资源,并(bìng)根(gēn)据需求(qiú)弹性扩(kuò)容。
与此(cǐ)同时,CloudIDE 与华为面向终端设(shè)备(bèi)的 AppGallery Connect 形成了有(yǒu)效协同。对于移动设(shè)备开发者、企业(yè)的(de)开发需(xū)求,可以提供包括(kuò)计算、存储、网络、数据库(kù)及 AI 在(zài)内(nèi)的等公有云(yún)资源,帮助开发者降低(dī)应用开发部署的难度和成本,从而让他(tā)们更专注于提(tí)升(shēng)应用(yòng)体验与打(dǎ)造(zào)优质(zhì)内容。
其次,华为云在开发代(dài)码托管(guǎn)中做出了(le)一(yī)系列创新(xīn),比如企业最关(guān)注的(de)代码安全性(xìng),华为(wéi)云的 CodaHub 从(cóng)访问(wèn)安全性到存储安全性再(zài)到 对(duì) Git-Crypt 的支(zhī)持,全方面(miàn)提升安(ān)全(quán)性(xìng)。
更进(jìn)一步,CodeHub 的代码模版共(gòng)享计划(huá),开(kāi)发者或企(qǐ)业,可以将(jiāng)自己的项目(mù)作为一个代码模(mó)版开放出来(lái),提供给行业共(gòng)同使用(yòng),这不仅体现了「我为人(rén)人、人人为我」的开源精神,也(yě)可以让更(gèng)多开发者通过「站在巨人肩膀(bǎng)上」的方式,实(shí)现更多(duō)创新。
第三,DevCloud 上(shàng)述(shù)两大服(fú)务(wù)与 AI 开(kāi)发的全面协同(tóng)效应。正如上文所言,CloudIDE 具(jù)备随时可取云端开(kāi)发资(zī)源的能力,这(zhè)也意味着,利用(yòng) CloudIDE,开发者可以快速搭建 AI 开发(fā)环境,而通(tōng)过 ModelArts SDK的样例模板,可以(yǐ)快速构建自己(jǐ)的项目。
portant;" />
在整个过程中,开发者(zhě)和企业(yè)根据自己的业务需求,定制不同(tóng)的计算/存储资源,快(kuài)速(sù)部署 AI 项目(mù)开发环境,然后引入 ModelArts 的 SDK,直接可以在 ModelArts 上完成训练与部署的一站式(shì)开发,其成本(běn)也仅仅是使用云服务的(de)成本。
5.写在最后:中(zhōng)国 AI 开发进入黄金时(shí)代
无论是将 AI 定义为第四次技术革(gé)命(mìng)的主要技术(shù)还是(shì)将其看作为一种通用目的(de)技术,AI 之于各(gè)行(háng)各业的意义已经(jīng)在(zài)过(guò)去几(jǐ)年(nián)初现出来——它(tā)将重(chóng)构众多行业数十年甚至上百年的游戏规则,并带来一次巨大的技术与商业创新。
portant;" />
这是技术带来产业(yè)的(de)新机遇。当国家层面的 AI 政策红利不断释放,当我国的 AI 算法(fǎ)、学术研究屡次(cì)获得国际赞誉,当各行各(gè)业开始拥抱 AI 的(de)开发、部署与应用,如何为(wéi) AI 开发(fā)落地提供一(yī)整套解(jiě)决方案,无疑(yí)成为摆在中国科技巨头(tóu)们面前的重要课题。
华为云正(zhèng)是其中一个重要玩家。
基于「达芬奇(qí)架构」芯片(piàn)赋能,为整个 AI 领(lǐng)域不断上涨的算力提供了解决方案,满足开发者、企业对于 AI 强(qiáng)大算力、多场景算(suàn)力的需求;利用(yòng) MindSpore 和(hé) ModelArts 的场景赋能(néng),在大(dà)幅降低 AI 开发门槛、加速企业 AI 开发的同时,还将利用开源持续推进中国(guó)自研 AI 框架的发展;围绕 CloudIDE 的云端开发环境,既可以释放华(huá)为(wéi)在 AI 芯片与 AI 框架的核心能力,还可以释(shì)放华为云的产业红利。
上(shàng)述三个方面,构成(chéng)了观察(chá)华为云全栈全场(chǎng)景 AI 战略的一个横切面。
华为依托自(zì)身在 ICT 领域的技术积累,过去几年迅速形成(chéng)了一套从数据中心到边缘设(shè)备的(de) AI 软硬产品线以(yǐ)及解决方案,从自研(yán)芯片到自主框(kuàng)架,从一站式开(kāi)发平台到云端开发集成环境,华为将一系列 AI 软硬件(jiàn)产品以华为(wéi)云(yún)公有云的方式使能各行各业,加(jiā)速各行(háng)各业步入 AI 开发、应用的快车道,实现行业数字化、智能化的变革。
一个可能的场景是,随(suí)着包(bāo)括华为云在内的中国 AI 基(jī)础设(shè)施服务商的快速发展,未来中国(guó)最好(hǎo)的(de) AI 应用一定是由中国 AI 芯(xīn)片(昇(shēng)腾芯片)驱动的 AI 框架与开发平台(MindSpore+ModelArts)和云端开发环境(CloudIDE+CodeHub)所开发,并运行在(zài)中国最领先(xiān)的云服务之一(华为云(yún)鲲鹏云服务)之(zhī)上,这个属于中(zhōng)国 AI 的黄(huáng)金时代(dài)正在到来。