新(xīn)冠(guàn)状病(bìng)毒(dú)推动(dòng)了人工智能(néng)的发展,也推动百(bǎi)度人(rén)工(gōng)智能领域全球领先
AI不应是某个国家、某个企业的(de)专利(lì),而是一种(zhǒng)技(jì)术底(dǐ)座和通用资源(yuán)。对于一家技(jì)术(shù)型公司而言,开放(fàng)恰恰是奠定领导者地位的(de)必经之(zhī)路(lù)。
3月18日,国际科技媒体Gigabit发表(biǎo)了一篇题为《百度如(rú)何悄然成为全(quán)球人工智能的(de)领导者》的文章,讨论了百(bǎi)度(dù)在(zài)人工智(zhì)能领(lǐng)域的战略(luè)布(bù)局,并(bìng)特意引述了百度CTO王海峰的观点(diǎn):
“和以往几次工(gōng)业(yè)革命(mìng)的驱动技术一样,人(rén)工(gōng)智能正在呈现出工业(yè)大生产的特征,例如标(biāo)准化、自(zì)动化和(hé)模块化。”
科(kē)技媒体(tǐ)PYMNTS也(yě)在3月18日报道了百度的AI技术,并(bìng)在(zài)文章中指出:COVID-19的大流(liú)行让越来越多(duō)的用户寻(xún)求在线医疗服务,百度的计算机视觉、自然语言理解和语(yǔ)音识别(bié)技术有(yǒu)着不可小觑的潜在价值(zhí)。
再稍早一些的时候,《麻省理工科技评论》发表了题为“百度如何运用人工智能(néng)抗击疫情(qíng)”的报道(dào),系统盘点(diǎn)了百度AI在病毒分析、实时筛查、辅助诊疗、大数据分析等方面的应用成(chéng)果(guǒ),并指出AI的应用规模是传染(rǎn)病史上(shàng)前所未(wèi)有的。
正如Gigabit在文章中所提到的,以往提到AI时往往会围绕(rào)亚马(mǎ)逊(xùn)、谷歌等(děng)进行讨论。如今亲历了抗疫一线的海(hǎi)外科(kē)技媒体们,显然对中国的互联网巨头有了新的认(rèn)知,百度等中(zhōng)国本土科技(jì)企业在抗疫中发挥的作(zuò)用,中国(guó)企业在(zài)人工智能领(lǐng)域(yù)的成绩,正(zhèng)在以“中国抗疫经(jīng)验”的(de)方式在全世界(jiè)传播。
同时海外媒体关注焦点的转变,以及百度AI等(děng)在(zài)抗疫过程中的开创性探索和规模(mó)化应用,也(yě)为我们带(dài)来了(le)新的思(sī)考:人工智能正(zhèng)在与物理世界建立紧(jǐn)密(mì)的(de)连接,这将为世界带来怎么样的改(gǎi)变?我们将复盘百度AI的全面(miàn)“战疫”。
某种程度(dù)上说,麻省理工科技评(píng)论等海外媒(méi)体为我们(men)提供了审视中国“科技抗疫”的(de)新视角,毕竟(jìng)人工智能的落地已经相当广泛,不少人(rén)对AI测体温、迁徙(xǐ)大数据等应(yīng)用已经习以为常,外媒的感(gǎn)知不失(shī)为客观总结这场全面战疫(yì)的线索。
沿(yán)循这样(yàng)的逻辑来复(fù)盘百(bǎi)度AI的应用,可以梳理成四个维度,即病毒分析、疫情防范、医疗诊断和复工复(fù)产,几乎每个维度都(dōu)给外界留下了深刻的印象。
1、病毒结构分析(xī)的时间战。
由于(yú)COVID-19新(xīn)冠(guàn)病毒有着难以预测、传染性强的(de)特征,学术和医学界普(pǔ)遍认为分析(xī)病(bìng)毒结构,并全力进行疫苗研发应当是抗疫的首要任务(wù)。
但挑战在于,RNA序列有(yǒu)着(zhe)丰富的空(kōng)间结构(gòu),RNA 二级结构预测需要三次(cì)方时间复(fù)杂度的算法,如果序列长度翻一倍的话(huà),就要付出(chū)8倍的计算时间。冠状病毒的基因组又是所有 RNA 病(bìng)毒里最(zuì)长的,即便(biàn)是(shì)最(zuì)快的经典(diǎn)算法完成3万(wàn)个碱基的预测,也需要至少55分钟(zhōng)的等待时间。
1月30日的(de)时候,百度向从事抗疫工作(zuò)的全球科研医疗团队免费(fèi)开放了LinearFold 线性时(shí)间算法(fǎ),以及世界上现有(yǒu)最快(kuài)的 RNA 结构预测(cè)网(wǎng)站,仅需27秒就能(néng)解出新型冠状病(bìng)毒全(quán)基因组的 RNA 二级结构,节省了两个数量级的时间。
为(wéi)此麻(má)省理工科技评论在(zài)报道中毫不吝啬的指出:“快速进行病毒结(jié)构分析(xī)可以(yǐ)大大缩短设(shè)计具(jù)有更(gèng)高稳定性和更(gèng)好效(xiào)力的潜在mRNA疫苗所(suǒ)需的时(shí)间,从而(ér)为(wéi)挽救千(qiān)万人(rén)生命(mìng)提供了(le)机会(huì)。”
2、疫(yì)情防范相(xiàng)关的速度战。
防疫的关(guān)键在于阻止疫情的(de)扩散,对于一个有14亿人口的国(guó)度而言,每天的流动(dòng)人口(kǒu)动辄数亿人次(cì),单凭人海战术已经很难应对(duì)这样(yàng)的(de)挑战(zhàn),而AI的价值恰恰在于解(jiě)放了(le)人力并发(fā)动了一场速度战。
令人印象(xiàng)深刻的是,百(bǎi)度(dù)地图在第一时间(jiān)上线了迁徙(xǐ)大数据平台(tái),客(kè)观地呈现了各(gè)个城市的迁徙(xǐ)、交(jiāo)通、人流等状(zhuàng)况,为(wéi)公众(zhòng)、媒体、政府提供了全面(miàn)、立(lì)体(tǐ)的(de)大(dà)数据(jù)服务(wù),让(ràng)疫情防控举(jǔ)措(cuò)建立在科学(xué)的数据基础上。截止到3月15号(hào)的(de)时候,百度地图迁徙大数据(jù)等平(píng)台已经提供了超过(guò)22.4亿次的服务。
在社(shè)区(qū)成为防疫一线的局(jú)面(miàn)下(xià),针(zhēn)对社区居民逐个进行排查、快速(sù)摸清健康情况和流动(dòng)情况可以说是控(kòng)制疫情蔓延的(de)有效手段(duàn)。百度则在第一时间推出(chū)了智能外呼平台,为(wéi)社区工作人员提供流(liú)动人员排查、本地居民排查/回访、特(tè)定人群通(tōng)知等场景的外呼服务,比人(rén)工电话效率提高了(le)数百倍。
此外在火车(chē)站、地铁站等核心(xīn)的交通枢纽,百度先(xiān)后推(tuī)出(chū)了AI测温(wēn)系统(tǒng)、口罩人脸检测等解决(jué)方(fāng)案,以非(fēi)接触、无感知的方式进行体温检测,判断出行人员是否(fǒu)佩戴口罩,既(jì)规(guī)避了人(rén)员聚集造(zào)成的交叉感染风险,也最(zuì)大程度提升了(le)检测(cè)速度。
3、深(shēn)入医疗诊(zhěn)断的效(xiào)率战。
2月(yuè)初的时候,肺部CT影(yǐng)像(xiàng)被正式纳(nà)入新冠肺炎的诊断标准,可同时也出现了(le)一(yī)些棘手的难(nán)题(tí):CT影(yǐng)像的量化(huà)评(píng)估主要依靠手(shǒu)工勾画ROI的方法(fǎ),每(měi)个患者需要勾画三四(sì)百张的CT影像,往往需要五六个小(xiǎo)时的(de)时间才能(néng)完成(chéng)。
如(rú)何提(tí)高CT影(yǐng)像量化评估的效(xiào)率?专注于医疗数据分析的连心医(yī)疗也基于百度飞(fēi)桨平台(tái)开发上线了“基于CT影像的肺(fèi)炎筛查与病情预评估AI系(xì)统(tǒng)”,将CT影像的(de)量化评估的时间压缩到了几十秒(miǎo),同时辅以双肺(fèi)密度分布(bù)的(de)直方图(tú)和病(bìng)灶勾画叠加显示等(děng)可视化手段,大幅度提升(shēng)了医生的诊断和评估效率。
除此之外,鉴于“居家隔离(lí)”引发的问(wèn)诊需求,百度健康在疫情(qíng)发生(shēng)后迅速(sù)上线了(le)“问(wèn)医(yī)生”免(miǎn)费服(fú)务(wù)通道,超过10万名来(lái)自公立(lì)医院的专业医生开始隔屏(píng)问诊,目前“问医生”的累(lèi)计咨询(xún)量已经超过2800万次,最高单日咨询量(liàng)高(gāo)达85万(wàn)次(cì)。
当国外疫情持续爆(bào)发时,百度健康还推出了“海外(wài)抗(kàng)疫公(gōng)益计划”,免费为海外同胞们提供医疗咨询、心理咨询(xún)、专家直播、防御工具等服务,协助广大(dà)海(hǎi)外侨胞和留学生应对当地医疗咨询服务难(nán)、出门问诊易被感染等问题(tí)。
4、快速复工复产的保(bǎo)卫(wèi)战。
当新冠肺(fèi)炎疫(yì)情被基本控制,能否有效组织复(fù)工复产,可以说是摆在眼(yǎn)前的(de)另一道难(nán)题。在(zài)前序几个环节(jiē)中可圈(quān)可点的百(bǎi)度AI,也有条不紊的打(dǎ)出了(le)一套组合拳。
先是在疫情高发期(qī)时,《新闻联播》就报道了微亿智造不停工的案例,主角正是百(bǎi)度(dù)和微亿智造(zào)联合(hé)打造的智(zhì)能自动化检测设备(bèi)——“表面缺陷视(shì)觉检测设备”,用人工智能替(tì)代人眼进行(háng)复杂表面缺陷检测,1秒内(nèi)可以对零部(bù)件(jiàn)6个面30多种缺陷进行准(zhǔn)确的检测,同时(shí)也减少了车间里(lǐ)疫情(qíng)传染(rǎn)的风险。
在远(yuǎn)程办公逐(zhú)渐成为焦点(diǎn)时(shí),百(bǎi)度及时推出了百度(dù)Hi企业智能远(yuǎn)程(chéng)办公(gōng)平台,并免费为湖北等(děng)疫区企(qǐ)业(yè)提(tí)供高清音视(shì)频会议、企业云盘、企业(yè)IM和应用中心平台等多项(xiàng)服(fú)务,满足疫情(qíng)期间不(bú)断增长的远程办(bàn)公(gōng)需求。
而在线下复(fù)工潮出现之际,百度又推出了企业AI入场解决方案,涵盖远多人、戴口罩、远距离的人脸检测,可以同(tóng)步进行测温、身份识别及后台校验,整个过程只需短短几秒的时间,而且无需接(jiē)触、无需(xū)停留,帮助企业快速(sù)、高效地完成入(rù)场(chǎng)检测,避免复(fù)杂检测流程导致的入场(chǎng)人(rén)群聚集。
这些案例并非是百度(dù)AI抗疫(yì)的全部,却不难洞察出(chū)AI在防疫中应用的(de)全貌:AI技术已经渗透到防疫的每一个环节,发挥了独特的技术价值,百度的(de)智能抗疫(yì)模式,无疑为全球各(gè)地提供了数(shù)字抗疫(yì)的样板。
正(zhèng)如百度CTO王海峰的观点:“中国科技界在从不同角度(dù)和领域为抗击疫情贡献力量。在这一过(guò)程中,百(bǎi)度(dù)一直发挥着自身在AI、大(dà)数据、搜(sōu)索、信息服(fú)务方面的优势,驰(chí)援一线(xiàn)的防(fáng)疫控疫工作,或帮助(zhù)前线抗疫工作者提(tí)升效率、保(bǎo)障安全(quán),或为政府和研(yán)究机构(gòu)提供科学的(de)数(shù)据参考,或为普通大众提供及时(shí)有(yǒu)效的服(fú)务。这是我们对(duì)’用科技让复(fù)杂(zá)的世界(jiè)更(gèng)简单’这一使命的践行,也是我(wǒ)们的责任和担当(dāng)。”
百度(dù)为何被外媒视为“全球AI领导者(zhě)”
需要指(zhǐ)出(chū)的是,参与到这场智(zhì)能(néng)战疫(yì)中的企业远不止百度(dù)一(yī)家,为何百(bǎi)度会成为外媒关注的焦(jiāo)点?
或许(xǔ)可以在两个方面(miàn)给出合理解释。
一是百度AI的技(jì)术优势。
2019年末的GLUE榜单(dān)上,百度的ERNIE预训练模型独占鳌头,不仅以(yǐ)9个任务平均得分突破90大关刷(shuā)新了GLUE榜单的历史(shǐ),还将微软MT-DNN-SMART、谷(gǔ)歌T5、ALBERT等一(yī)众国际(jì)顶级预训练模型甩在(zài)了身(shēn)后。
通用(yòng)语言理解评估基准(zhǔn)GLUE一直是自然(rán)语言处理领域最权威的排行榜之一,涵盖自然(rán)语言(yán)推断、语义相似度、问答匹配、情感分析等(děng)9大任务,业已成为衡量自(zì)然语言处理研(yán)究进展的(de)行业标准。GLUE排行榜,也在一(yī)定(dìng)程度上成为衡量自然语言(yán)处理预训练技术水平的重要(yào)指(zhǐ)标(biāo)。
在技(jì)术为王的互联网世(shì)界里,站在(zài)自然语言处理(lǐ)潮头的百度自(zì)然会吸引(yǐn)外界的关注,百度AI的应用(yòng)方向、领域和规模(mó),也就成了判断行业趋势的风向(xiàng)标之一。特别是在(zài)新冠肺炎(yán)疫情正(zhèng)在冲击全球人(rén)民正常的生活秩序时,百度的(de)模式和经验预(yù)料之(zhī)中(zhōng)的成了国外(wài)媒体和企业“抄作业”的对象。
二是百度AI的开放姿态。
并(bìng)非是所(suǒ)有(yǒu)的国家都有谷歌、百度这(zhè)样的科技巨头(tóu),也不是所有的(de)科技大厂都(dōu)能在AI领域占据一席之地(dì),AI能(néng)否成为一(yī)种通用方案超越国界?一(yī)个直接的例子,百度AI战疫的诸多应用(yòng)并(bìng)非全部源于百度的一己之力。
前(qián)面提到的“基于CT影像的肺炎筛查与病(bìng)情预评估AI系(xì)统(tǒng)”,属(shǔ)于连心医疗在百(bǎi)度飞桨(jiǎng)平(píng)台上的开(kāi)源项目,并(bìng)且已经(jīng)向外界免费(fèi)开放;
中(zhōng)国移动免费开放的“小(xiǎo)One易统计(jì)”工具,采用(yòng)了百度(dù)地图及百度大脑(nǎo)的(de)OCR身份(fèn)证智(zhì)能识别技术,能(néng)够(gòu)完成人员位置信息、健康(kāng)情况统计工作,解决了小区、超市等场景流动人员(yuán)信息统计难的问题;
大连厚仁研发的 “出口成章”APP,为(wéi)全国(guó)600万学生用(yòng)户(hù)和20万语(yǔ)文(wén)教师用户提(tí)供体系化、个性(xìng)化、自(zì)适应的在线课程和直播课堂服务的移动端(duān)应(yīng)用,百度大(dà)脑同样扮演了幕后的角色(sè),提(tí)供(gòng)了免费算力资源(yuán)、语音识别技术接口,以及专(zhuān)门(mén)的定向服务和对接通路(lù),来保障中小(xiǎo)学生流(liú)畅稳定地在线学习。
类似的(de)应(yīng)用还(hái)有很(hěn)多,几乎(hū)覆盖了自然语(yǔ)言处理、语音识别、计算机(jī)视觉、自动驾(jià)驶等所有热门的AI技术(shù)领域,也(yě)对(duì)外演示了人工智能的另(lìng)一种可能:AI不(bú)是某(mǒu)个国家、某个(gè)企业的专利(lì),而(ér)是一种技(jì)术底座(zuò)和通用资源。同(tóng)时对于(yú)一家技术型公(gōng)司而(ér)言(yán),开放恰恰是奠定领导者(zhě)地位的必(bì)经(jīng)之(zhī)路。
关于百度选择开放姿态的(de)原因,王海峰曾(céng)多(duō)次向外界阐述这样一个(gè)观点:“工业大生(shēng)产的(de)技术有非常强的通用性(xìng),这(zhè)些技术也(yě)呈现出(chū)一(yī)些显著的特征。所(suǒ)以,我认为一个技术同时拥(yōng)有标准化(huà)、自动化和模块化的特征,可以影响各行(háng)各业,就具(jù)备(bèi)进入工业大生产阶段(duàn)的(de)一(yī)些(xiē)基本前提。”
那么,也就不难理解百度频频(pín)被(bèi)外媒点赞的原因(yīn):既是国(guó)外值(zhí)得学习的中国抗疫经验,同时百度在抗疫过程中沉(chén)淀的AI应用经验,也给中国产业智能化和(hé)社会智能化积(jī)累下了的(de)宝贵财富(fù)。
对于前一点似(sì)乎已(yǐ)经没有(yǒu)太大的争议(yì),第二(èr)点也可以看到种种趋势,比如人(rén)工智(zhì)能、大数据中心(xīn)和工(gōng)业(yè)互联网已经被列(liè)入“新基建”的范畴,不(bú)啻是(shì)一(yī)次产业爆发(fā)性增长的(de)良机(jī);再比如百度新一轮(lún)的组(zǔ)织架构调整中(zhōng),王海峰在内部信中表示“新基建”的号角已经吹响,百(bǎi)度将(jiāng)以扁平化管理提升组织效能,进一步推(tuī)动(dòng)“AI+云(yún)”战略(luè)。
无论是外部的商业环境(jìng),还是百度内部战略调(diào)整,人工智能的赛道上的“领导者”身份绝不是(shì)一句谬赞。
做一个总结的话:百度的(de)智能抗疫模式与经验,让(ràng)我们看到了一家科(kē)技巨头(tóu)的担(dān)当精神(shén)和(hé)高效的执行力,却也只是百度AI的小(xiǎo)试牛刀。在“新基建”的(de)时代号角下(xià),“AI工业化大(dà)生产”正(zhèng)在从“涓滴(dī)”加速成为“洪流”,不断夯实智能时代(dài)的基础设施,向(xiàng)世(shì)界输出撬动第四次工业革(gé)命(mìng)的“中国经验”。