在科技领域,跨(kuà)界(jiè)、融(róng)合带来(lái)的新(xīn)生事物具备的(de)颠(diān)覆性竞争,而只是(shì)技术和经济(jì)层面的竞争。
而在病毒领域,跨界、融合产生的新病毒往往意(yì)味着灾(zāi)难。一个天上(shàng)飞的鸟落下的粪便不小(xiǎo)心(xīn)与(yǔ)地上某个禽类(lèi)的(de)食物结合被这个禽类所食,那么(me)其上可能带来的病(bìng)毒与禽(qín)类体内病毒进行杂交进化一个新的(de)病毒(dú)。而这(zhè)个病毒获得跨界传播的能力,将对整个人类造成大的灾难(nán)。最(zuì)快速(sù)的了(le)解新的病毒带来的病例成因早日实现对症下药,成(chéng)为打(dǎ)赢“抗疫”的关键。今天AI等新(xīn)技(jì)术在积极发挥着作用。
目前新型冠状(zhuàng)病毒(dú)疫情进入了攻坚战(zhàn)阶段。除了一线医(yī)务人员(yuán)前赴后继的战斗之外,对于新冠病毒的疫苗研发和(hé)药物筛(shāi)中也在争分夺秒(miǎo)的进行中。此次“抗疫”战(zhàn)争中,AI等科技技(jì)术在默(mò)默贡献中(zhōng)。关注抗击疫情中的科技公司的(de)动向,就会发(fā)现包括阿里云、华为云、中科曙(shǔ)光、腾讯云、上海(hǎi)超算中心等积极(jí)主动并免费提供超算(suàn)能力(lì),AI算法来助力开展抗(kàng)新冠病(bìng)毒的疫苗研发和药(yào)物筛选中。
要最快解决(jué)此(cǐ)次新型冠(guàn)状病(bìng)毒疫情(qíng),目(mù)前来看(kàn)除了全国动员(yuán)在家“闷”死(sǐ)病(bìng)毒之外,对于从(cóng)早期对病毒基因组的数据分析及AI建模到如(rú)何对疑似(sì)患者(zhě)的快速(sù)、精准(zhǔn)临床诊断,以及(jí)抗新冠病毒的(de)疫(yì)苗(miáo)研发(fā)和药物筛选中也需要和时(shí)间赛跑。在其中AI正在发挥其作用。
AI技(jì)术(shù)能够加速(sù)“疫情”中数据分析
AI作为一种工具,有三要素在支撑(chēng),算(suàn)力、算法和数(shù)据。基(jī)于三个特点,目前AI等科技公(gōng)司都(dōu)是提供具(jù)备高(gāo)性能、高可(kě)靠(kào)性、高(gāo)性价(jià)比的(de)计算、存(cún)储(chǔ)、分(fèn)析(xī)和AI能力(lì)支持的,能够让(ràng)科研(yán)过程固化可执行,提高效率的工具(jù)。
而让AI在疾病基因的分析和诊断中(zhōng)发挥。首(shǒu)先要依靠医学界的专家发(fā)现病毒(dú)。就像上海华山医院张文宏就谈到医疗(liáo)专家要“要非常准确的知道现在搜索的病毒是什么,才能相应的病毒(dú)做相(xiàng)应的抗病(bìng)毒治疗(liáo)。”
我们应让人工(gōng)智(zhì)能与病理学家形成互补,提高人工诊(zhěn)断的(de)效率与(yǔ)可靠度。依靠科技手(shǒu)段 “面(miàn)对未知的病毒(dú)的时候,通(tōng)过把其(qí)基因序列全部打碎,通(tōng)过深(shēn)度测(cè)序(xù)的平台,把所有的序列全部恢复,然后通(tōng)大数(shù)据开始拼接,通过(guò)组装序列(liè),经过大数据分析,分析出其(qí)演(yǎn)化关系,通(tōng)过数据库记录(lù)分析获得遗(yí)传标志(zhì),来最终告诉你(nǐ)这是什么病毒。” 张文宏站在(zài)医生的角度言简(jiǎn)意赅的(de)阐述了AI的作用。
portant;" />
比如针(zhēn)对此次新冠病毒,AI等新技术的(de)应用一个核心的作用(yòng)就是让(ràng)医学专家(jiā)们不用把大(dà)量(liàng)的时(shí)间(jiān)放(fàng)在海量(liàng)的数(shù)据分析上,而是能够(gòu)将自己的时间(jiān)、精力以(yǐ)及医学经验投入(rù)到应对(duì)传染(rǎn)病风险之(zhī)上。把数据分析、重复的信息的收集等任务,交给AI来(lái)处理(lǐ)。
目(mù)前集成了(le)AI功(gōng)能的基因组测(cè)序平(píng)台能够提供从基因(yīn)组(zǔ)数据管理、生物(wù)信息分(fèn)析流程、科研(yán)分析管理到知识(shí)图谱整(zhěng)个流程的(de)服务,快(kuài)速(sù)实(shí)现基因组数(shù)据分析(xī)及AI建模(mó),让基因组分析(xī)更便捷。
比如将深度学(xué)习算(suàn)法及药(yào)物分析服务融(róng)入药物研(yán)发过程,令药企能更快(kuài)速高效地完(wán)成药物研发,节约研发成(chéng)本,让研(yán)发更快速。
具备医疗影像标注(zhù)、影像分析服务及AI模型预(yù)测服务,全(quán)方位满足医疗影像研发需(xū)求,让(ràng)影像分析(xī)更方便。很(hěn)大(dà)程度上帮助了医生提高阅片效率、减(jiǎn)少漏诊(zhěn)误诊的情况。一个医生(shēng)可能一天看一百个病人,一个(gè)月看了两千个病人,一年可能看几万(wàn)个病(bìng)人(rén),他通(tōng)过这样的方式去累(lèi)计经验(yàn)。一(yī)个15年经验的(de)医(yī)生(shēng),和一个刚出来做3个月的医生,他们两(liǎng)个的经验不同,在对一些影像图片上面(miàn)的(de)判断就不是一样的级别。
portant;" />
深度(dù)学习会提取(qǔ)图像特征。然后影像专家先把上(shàng)面做一个标(biāo)注,等到标注有更大(dà)的(de)样本的时候,就可以做到辅助医学(xué)诊断。比如通过(guò)AI对疑(yí)似患者(zhě)肺部CT影(yǐng)像进行(háng)病灶的(de)自动检出、定位、弥漫性程度的多维分析并生成自动(dòng)报(bào)告,帮助医护人员快(kuài)速筛(shāi)查疑似新冠(guàn)病(bìng)例并进行隔离与进(jìn)一步确诊,从而减少交叉感(gǎn)染的风险,同时产品的随访功能还可帮(bāng)助医生对患(huàn)者的治疗效果进行精准量化评估,用AI为一(yī)线医(yī)务工作(zuò)者提(tí)供有迹可循(xún)、有据(jù)可依的智能辅助。
联合科研成为AI技术应用在(zài)疾病(bìng)领(lǐng)域的主要(yào)形(xíng)式
在整个“抗(kàng)疫”过程中,包(bāo)括分离(lí)毒株(zhū)、药物筛(shāi)选、意思(sī)病例检测、新药(yào)研(yán)发等需要(yào)基于AI技术(shù)进行大量(liàng)的(de)数据分析。目前科(kē)技公司在病毒基因组计算分析、抗病毒(dú)药物研(yán)发(fā)和抗疫医疗(liáo)影像分析领(lǐng)域,将提供海(hǎi)量AI算力和算法的强有力支持。这就需要具有强大的CPU及GPU算力(lì)调度能(néng)力,能(néng)够为基因测序、医疗工(gōng)程提供稳(wěn)定高效的算力支持的平台。
最近(jìn)关于“抗(kàng)疫”的战役中,我们看到科技公司联合医疗机构(gòu)、科研机构(gòu)成为最高效的一(yī)种模式。比如华(huá)中科技(jì)大学同济(jì)医学院基础医学院、华中科技大(dà)学同济医学院(yuàn)附属武汉儿(ér)童医院、西安交通大学(xué)第一(yī)附属医院、中科院北京基因组研究所、华为云联合(hé)科研团队宣布,筛选出五种可能(néng)对2019新型(xíng)冠(guàn)状病毒(2019-nCoV)有效的抗病(bìng)毒药(yào)物。
其中华为云EI医(yī)疗智能体(tǐ)平台(EIHealth)集成(chéng)了医药领域(yù)众多(duō)算法、工具、AI模型和自动化流水线提供大规模计算机辅助。
portant;" />
在几位(wèi)教授的指导下,针对数十个靶向蛋白和上亿小(xiǎo)分子化合(hé)物(wù),通过医疗智能体平台完成了(le)蛋白质同源模(mó)建,分(fèn)子动力(lì)学(xué)模拟计算,和大规模虚(xū)拟药物筛选,短时(shí)间内(nèi)完(wán)成了上千万次的(de)模拟计算,让以往耗时数月的计(jì)算机辅助药物筛选在数小(xiǎo)时内完成。
比(bǐ)如在新冠肺炎疫情上,疑似患者的(de)快(kuài)速、精准临床诊断仍是挑战(zhàn)。2月1日,由(yóu)浙江省疾控中(zhōng)心、阿里达摩院和杰毅生物联合(hé)研发上线的自动化全基因组(zǔ)检测分(fèn)析平台,让原来(lái)数小时的疑似病例基因分(fèn)析缩短至(zhì)半小时。重(chóng)点在“全基(jī)因(yīn)组”这(zhè)几个字,全基因组以为着海量(liàng)的基因数据,需(xū)要对平台的算力(lì)、AI算法、数据处理和分更(gèng)高的要求。阿里达摩院创新的采用分(fèn)布式设计的分析算(suàn)法,并基(jī)于蛋白(bái)质数据(jù)库(kù)(PDB)等公共数据集的数据进(jìn)行算法的优化训(xùn)练。这样的AI突(tū)破,对于有(yǒu)效提(tí)升疑似病例确诊效率,及时阻断(duàn)病毒的传播,必然会有极大助(zhù)益。
我们也看到(dào)为助力研究机构加速(sù)新药(yào)筛查和(hé)疫苗研发(fā),腾讯云组建了应急工作小组,免费开放云超算等能力(lì)。目前,已向中山大学药学院罗海彬(bīn)教授团队提供(gòng)了批量GPU云(yún)服(fú)务器免费使用权,帮助该团(tuán)队推进病毒药物的筛选工作;向北京生命科学研(yán)究所/清华大学生物医学交叉研(yán)究院的(de)黄牛教(jiāo)授实验室提供了大(dà)量标准的CPU算力以(yǐ)及对象(xiàng)储存能力,帮(bāng)助他们(men)进行(háng)基于结构的药物分子(zǐ)设计的(de)离线计(jì)算(suàn)任(rèn)务。
与(yǔ)此同时(shí),基(jī)于新型冠(guàn)状(zhuàng)病(bìng)毒靶(bǎ)标结构的化合(hé)物虚拟筛选工作正在北(běi)京(jīng)生(shēng)命科学研究(jiū)所/清华(huá)大学生物医(yī)学交叉研(yán)究院黄牛(niú)教(jiāo)授实验(yàn)室推进(jìn)。从(cóng)原理上讲(jiǎng),药物通过与体内(nèi)的生(shēng)物靶标(biāo)相(xiàng)互作用而(ér)发挥药效,若能够根据(jù)药物靶标(biāo)结构来(lái)计算筛选和设计(jì)小分子配体,将可(kě)大大降低创(chuàng)新(xīn)药前期研发的成(chéng)本与周期。针对新型冠状病毒的(de)多个靶点,黄牛教授实验(yàn)室通(tōng)过腾(téng)讯(xùn)云(yún)秒级交(jiāo)付的(de)海量高性能计算(suàn)、存储资源,快(kuài)速(sù)计(jì)算(suàn)筛(shāi)选数亿级别的化合物(wù)数据库,结合实验验证,来寻找新型结(jié)构类型的先导化合物(wù),为下一步新药研发工作提供依据(jù)。
总结,AI对于基因组的分(fèn)析和(hé)诊断,有几个关键点。首先数据库的(de)检索功能,在获取到病毒基因信息后,通常需要与(yǔ)已(yǐ)知数据(jù)库(kù)的基(jī)因(yīn)组匹配(pèi)来找(zhǎo)出可能存在的突变。而突变与疾病(bìng)的对应关系的判断大部分依靠海(hǎi)量的数据库资(zī)源,因此(cǐ)如(rú)果人工来(lái)完成这些工作是不现实(shí)的(de),这个时候便体现出了人(rén)工(gōng)智能(néng)的价值。
其次算法的优化,我们看到(dào)包括华为(wéi)云、阿里达摩院都是采用(yòng)了最新的AI算法和(hé)分布式数(shù)据(jù)库,来优化人工智能(néng)的技术(shù)路径,能够更有效的对大量非(fēi)结构化数据(jù)进(jìn)行学(xué)习和整合,挖掘并计算其中的关联。缩短人工(gōng)智能可以持续不断的挖(wā)掘并更新突变位点和疾病的潜在(zài)联系。
再次海量的数据喂(wèi)养,与在Google AI实践中曾(céng)有关于诊断乳腺癌(ái)的人工智能的报道。它只需几秒钟(zhōng),就(jiù)能取得比人类医生(shēng)花上几十(shí)个(gè)小时还(hái)要准(zhǔn)确的诊断。在基(jī)于医学图像的诊断(duàn)上,结合人工智能(néng)的(de)效率可以说是大大增加了癌病的诊(zhěn)断。这需(xū)要基于(yú)大量患者的成百上千张医疗影像,基于深度学习算法的训练。经历(lì)了(le)大量(liàng)迭代训练(liàn)后,实现算法(fǎ)的精(jīng)准度越来越高,实(shí)现在疾病(bìng)分析(xī)丰富临床经验的专家的诊断结果(guǒ)与(yǔ)AI工具的(de)诊断结果是否一致来判断AI分析的(de)价值。
除此之外,业内专家对至顶网表示目(mù)前基(jī)于“深度学习”的AI技(jì)术要发(fā)挥(huī)作用,一个好(hǎo)的(de)云(yún)数据(jù)库其(qí)实是非(fēi)常关键(jiàn)的一个点,因为如果医院(yuàn)里面每个科室的数字是零散(sàn)的,那(nà)么很难做(zuò)这个(gè)工作。基于(yú)云数据(jù)库,不管是从公有云还是从私(sī)有云,帮(bāng)助(zhù)医院把这些数据规范起来。从数据(jù)的采集,到它的存储(chǔ),到预处理,形成一套规范的AI服务。这(zhè)样的话,数(shù)据(jù)即使在有些(xiē)单位是分散的,需要的时候还是可以复合起(qǐ)来使用(yòng)。
同时在(zài)深度学习的(de)技(jì)术上面,对这些(xiē)数(shù)据(jù)做训(xùn)练的时候,不仅仅是把数据丢到深度学习里面(miàn)去训练(liàn)就好(hǎo)了,而且我(wǒ)们还要(yào)对这些数据做(zuò)一些特征提取。我(wǒ)们把(bǎ)数据的维度降低了以后,再去训练就(jiù)可以(yǐ)得到一个(gè)相对比(bǐ)较好的效果(guǒ)。当然,这(zhè)个数(shù)据积累以后,越来越多的数(shù)据(jù)积累以后,准确率会越来越高。
最后,医疗(liáo)过程(chéng)是一个复杂,周期长的过程,AI辅助只是其(qí)中一个环(huán)节,我们(men)希(xī)望能够通过AI等科技技术帮助(zhù)到医药领(lǐng)域的专家,加(jiā)速疾病基因(yīn)检(jiǎn)测和相关(guān)药(yào)物研(yán)发过程。