刚刚结束的百度大脑语(yǔ)音能(néng)力引擎论(lùn)坛,向外界披(pī)露了这(zhè)样一个数字:百度大脑(nǎo)的(de)语音能力引擎日均调用量已经(jīng)超过(guò)100亿次。
对照(zhào)国内8.54亿的网民规模,平均每个人要和百度大脑的语音(yīn)能力引擎每天(tiān)接触12次,场景涉及(jí)输入法的语音输入、智能音箱的语音对话、百度地图的语音导航、与(yǔ)各种机(jī)器人的(de)有趣互动……无论是(shì)覆(fù)盖(gài)范围(wéi)还是使用频次(cì),早已超(chāo)过(guò)99%的(de)互联(lián)网服务。
可能在不少人的印象(xiàng)里,人工(gōng)智能还是遥不可(kě)及的新事物,百度大脑用数据告(gào)诉了我们这样一个事实:人工智能并(bìng)不遥远,甚至已经(jīng)是生(shēng)活(huó)中不可或缺的一部分。
portant;" />
01 日均调用(yòng)100亿次的背后
如果(guǒ)仅仅盯着数字来(lái)看,100亿不(bú)可谓不庞大,也(yě)奠定(dìng)了百度大(dà)脑语音应用规(guī)模第一(yī)的(de)成绩。但比数字本身更(gèng)有价值(zhí)的是(shì),百度(dù)大(dà)脑如何做到语音能力(lì)引擎日均调用量超过100亿次的规模(mó),以及100亿次(cì)的语音到底(dǐ)“唤醒”了什么?
第一个(gè)问题的(de)答案是开放(fàng)。截止到目前,百度大脑已经开放(fàng)了云、端、芯(xīn)的全栈全场景语音(yīn)开放能力,广泛应用于文(wén)娱、金(jīn)融(róng)、政务等(děng)多个行业(yè)和场景(jǐng),开发者们只需要一(yī)个简单的(de)调用,即可为(wéi)产品(pǐn)接入百度大(dà)脑的智能语(yǔ)音(yīn)能力。
而从百度(dù)大脑语音能力引擎论坛传(chuán)递的消息来(lái)看,百度大脑(nǎo)的语音(yīn)引擎(qíng)全新发布和升级了14大产(chǎn)品内(nèi)容,包括(kuò)基于百度鸿鹄语音芯片(piàn)的4款硬件模组、开发板,针对智(zhì)能家(jiā)居(jū)、智能车(chē)载、智能IoT设备等端到端的软硬一体远(yuǎn)场语音交互场景解决方(fāng)案,语音自(zì)训练平台、呼叫中心语(yǔ)音(yīn)解决方案的升(shēng)级,以及6个在线(xiàn)语音(yīn)合成精(jīng)品音库和5个离线语音合成精品音的发布。
简单(dān)来说,百度大脑(nǎo)已(yǐ)经为语音能力引擎打(dǎ)造(zào)了一条应(yīng)用落(luò)地的(de)生态(tài)链,而(ér)且生(shēng)态链所覆盖的场景和能力(lì)还(hái)在不断拓展。
至于第二个问题的(de)答案(àn),不(bú)妨先来看(kàn)三(sān)个具体(tǐ)的应用案(àn)例。
创维AIoT研究院产品经理李(lǐ)凯在演(yǎn)讲中谈及创维和(hé)百(bǎi)度大脑的合作(zuò),在百度鸿鹄语音(yīn)芯片等软硬件的赋(fù)能下,创(chuàng)维(wéi)为产(chǎn)品增(zēng)加了语音(yīn)交互能力,涉及2500万(wàn)台的电(diàn)视装(zhuāng)机量,用户只需要一(yī)个语音指令(lìng)就(jiù)能(néng)找到自己喜欢的(de)电视节目,让电视(shì)的交互从遥控器直接进化到智能语音时(shí)代。
北京子(zǐ)杰宝贝科技有限公司将(jiāng)百度大脑的语音能(néng)力引(yǐn)擎带到了医疗(liáo)领域,之前60%的医(yī)护人(rén)员每天要(yào)花费45分钟到90分钟(zhōng)的时间填写表(biǎo)单数据(jù)。依靠百(bǎi)度大(dà)脑的语音识别、自然语言处(chù)理等技术,医护(hù)人员如今用语(yǔ)音就能完成表单的录入。
善行智能在百度大脑的智能语音技术、智能OCR识别(bié)、智能物体识别等技术(shù)的加持下,打造了可以智能识别障(zhàng)碍物、物品、钱(qián)币等物(wù)体,并通过语音播报给(gěi)用户的小(xiǎo)Q智(zhì)能导盲眼镜,帮助盲人群体独立的认知世界。
诚然,“100亿次日均调用量”的背后是(shì)人工智能落地应用(yòng)的(de)生态圈,为(wéi)合作伙伴带来了转(zhuǎn)型(xíng)的(de)契机,为医护人员(yuán)解决了工作的痛点,也让盲人群体(tǐ)感受到了AI的温暖。而这(zhè)些仅(jǐn)仅是(shì)百度大(dà)脑技术赋能的(de)冰山一角。
02 AI赛道中的“学霸”人设
除了智能语音的(de)落地应用,百度大脑(nǎo)还在不断推动语音技术的发展(zhǎn),比(bǐ)如百度(dù)语音首席架构师贾(jiǎ)磊提出的基于复(fù)数CNN网络的语(yǔ)音增强和(hé)语音识别一体化(huà)端(duān)到端建模技术(shù),相较于传统基于数字信号处理(lǐ)的(de)麦克(kè)阵列算法,新技术的(de)错误率降低了30%以上,并且已经被集(jí)成(chéng)到最新发布的百度(dù)鸿鹄(hú)芯片中。
身(shēn)为人工智能赛(sài)道里的(de)“学霸”,百(bǎi)度大脑并非是擅(shàn)长语音(yīn)技术的偏科生,而是一个典(diǎn)型的“别人家的(de)孩子”。
在乌镇智库出品的《全球人工智能(néng)发展报告(gào)》中,专(zhuān)门(mén)罗列了中(zhōng)国AI专利ToP 10的企业,百度以935件的专利数量(liàng),毋庸置疑的成了榜单上的头名选(xuǎn)手(shǒu),并与腾讯、阿里等同一阵营的玩家们拉开了较大的(de)差距。
在国际权威研(yán)究机(jī)构Forrester发布的计算(suàn)机视觉公有云报(bào)告中(zhōng),在百度大脑的(de)AI视(shì)觉技术加持(chí)下,百度智能云处(chù)于(yú)中国市场“领导者”领域最上方 ,在(zài)数据、解(jiě)决方案、应用(yòng)场景、管理能力等多维度领先于阿里云、腾(téng)讯(xùn)云等厂商。另一份《IDC MarketScape:2019中国(guó)AI云服务市场厂商评估》中,凭借在能力和市场两个维度(dù)的优异(yì)表现(xiàn),百度(dù)智能云同样位居(jū)领导者(zhě)象限最上方。
在4月初结(jié)束的ICME人(rén)脸106关键点检测比赛中,百度大(dà)脑力压阿里、华为、美团、中(zhōng)科(kē)大等选手拿到冠(guàn)军(jun1);6月份的(de)CVPR 2019上,百度大(dà)脑又在(zài)视频理解与(yǔ)分析、目标检测、图像超分辨、智能城市车(chē)辆识别、人脸&人体检测等领域斩获了10项(xiàng)冠军;11月份的ICCV 2019上,百度(dù)大脑视觉团队以mAP值57.13%的成绩夺得人脸检测的冠军,超(chāo)过第二(èr)名0.47%……
如果从时间上看,2016年百度大脑(nǎo)对外开放至今(jīn)不(bú)过(guò)三年时间,纵然离不开百度(dù)长期的技术(shù)积累,这么短时间里的全面开花无疑佐证了百度大脑的“学霸”人设。这样的成长速度(dù)与百(bǎi)度的技术(shù)基(jī)因(yīn)、工程师文化等不(bú)无关系,或许还有另外一重原因。
2017年的时候,就(jiù)有人将中美(měi)在(zài)人工智(zhì)能赛道中的角色比作星(xīng)球大战里(lǐ)的Luke和Darth Vader,甚至为双方(fāng)进行了“战力”对(duì)比:美国(guó)AI公司的(de)数量比中国高(gāo)出1.82倍,流向美国的资金份额(é)比中(zhōng)国(guó)高1.54倍,美国(guó)的AI人才库(kù)亦是中国(guó)的2.01倍……美国在人工智能领(lǐng)域的强力基础,有赖于(yú)Google、亚(yà)马(mǎ)逊、IBM、微(wēi)软等先(xiān)行(háng)者,中国人工(gōng)智能(néng)的担子(zǐ)自然就(jiù)落到了BAT身(shēn)上。
某种程度上说,“学霸”百度大脑还肩负(fù)着抹平中美AI力量鸿沟的义务(wù),而从(cóng)一系列国际赛(sài)事上(shàng)的表现、国际权威机构(gòu)的认证(zhèng)来看,百度大脑也是中国AI领域当之无愧的头雁,构建起(qǐ)AI的全栈技术布局,平等的赋能每一位开发者,将是百度大脑现在和未来身体(tǐ)力行的(de)使命(mìng)所在。
03 百度大(dà)脑在持(chí)续刷新
百(bǎi)度首席技(jì)术官王(wáng)海峰在百(bǎi)度大脑语音能力引擎论坛讲(jiǎng)到(dào)进化和赋(fù)能:“AI技(jì)术的进化和(hé)产业赋能正向循环(huán),相互促(cù)进,AI在应(yīng)用场景中不断进化。”可以理解为这(zhè)就是百度大脑对自身的使命,也促使(shǐ)百度大(dà)脑在持续(xù)“刷新”。
犹记得(dé)2016年的百度(dù)世界大会上,李彦宏(hóng)用了相(xiàng)当(dāng)长的篇幅来(lái)讲述这个“新概念”,彼(bǐ)时还只是记(jì)住了“百度大脑”这个名字,至于会产生什么(me)样的(de)影响(xiǎng),恐(kǒng)怕很多人并没(méi)有(yǒu)答(dá)案。然而短短(duǎn)三年的时间里,百度大脑(nǎo)早已成了生活中的一部分,百度输入法(fǎ)的语(yǔ)音输入,入(rù)住酒店(diàn)时的刷脸认证,农田里的遥感无(wú)人机,工厂(chǎng)里的智能零件分(fèn)拣……在那些看得到和看不(bú)见的生产生活场(chǎng)景中,都有(yǒu)着百度大脑的身影(yǐng)。
截止(zhǐ)到目前,百度(dù)大脑已经开放了228项AI能力,拥有超过150万(wàn)的开发(fā)者用户(hù),当年李彦(yàn)宏(hóng)对百度大脑的寄(jì)托已(yǐ)经逐步(bù)实现。但百(bǎi)度大脑并没有止步于此,在(zài)完成AI能力与应用场景融合创新的第一步后,百度大脑在5.0升级时被定义(yì)为“软硬一体的(de)AI大生产(chǎn)平台”,让AI迈(mài)入产业世界与(yǔ)工(gōng)业大生产进行融合。
与之对应的是,语音(yīn)技术推出了风格迁移的语音合成技术(shù),仅需(xū)20句话就可(kě)以制作一个人的专属声(shēng)音;视觉方(fāng)面形(xíng)成了适用于不同应用场景的技术矩(jǔ)阵(zhèn),诸如车(chē)辆识别、物体识别、风格转化、人流量(liàng)统计(jì)等等(děng);语言与知识方面,构建了世(shì)界上最大(dà)的多元异构知识图谱……除了技(jì)术能力的刷新,百度(dù)还将算力、算法和数(shù)据打通,以百(bǎi)度(dù)智能云为依(yī)托,以百度大脑为核心(xīn),以(yǐ)飞桨为基础底座,为各行各业的(de)智能化转型升级提供强有力的支(zhī)撑。
市场的反映也印证了(le)百度的正确性,仅(jǐn)以(yǐ)百度大脑人脸公有云服务(wù)为例(lì),公有云日均(jun1)调用量(liàng)超过1亿,开发者超过(guò)13万,用户使用(yòng)规模稳居业界第(dì)一(yī)。并且(qiě)百度大脑在人脸识别(bié)领域积(jī)累了1000多家合作伙伴(bàn),落地了超过10万个项(xiàng)目,形成了丰富、完整的人(rén)脸产(chǎn)品矩阵。
同样“刷新”的(de)还(hái)有百度大脑的人才体(tǐ)系(xì)。就(jiù)在不久(jiǔ)前,著名的(de)计算机和大数据理(lǐ)论(lùn)领域专家Jeffrey Vitter加(jiā)入到百度研(yán)究院顾问委员(yuán)会,美国俄勒冈大学教授窦(dòu)德景也加盟百度研(yán)究院担任大(dà)数据实验室(shì)主任。从(cóng)世(shì)界级(jí)科学(xué)家组成的顶级(jí)智囊(náng),到百度庞大的一线工程师,百度大脑在为行业赋能,驱动AI走进工业大生(shēng)产时(shí)代的(de)同时,也在(zài)不(bú)断将AI技术做透、做精、做深。
“刷新”是百度大(dà)脑的底色,也是持续(xù)修炼内功让(ràng)AI走进真(zhēn)实(shí)世(shì)界(jiè)的态(tài)度。
04 写在最后
从2016到2019,人(rén)们对AI的理解已(yǐ)经不再局限于(yú)围棋大战(zhàn),可在谈论AI的时候,核心算法上的瓶颈仍然是不少开(kāi)发(fā)者的锥心之痛(tòng)。百(bǎi)度大脑(nǎo)就像(xiàng)一个扛着挑战一路向前的勇(yǒng)士,在每一个关键(jiàn)节点上为业界开辟出一条条新路。
读懂了这一点,语音(yīn)能力(lì)引擎的100亿次日均调用,注定只是百度(dù)大脑(nǎo)的一个小目标,因为“让开发者(zhě)平等地获取AI能力”这(zhè)条路本就没有终点。