2020年11月20日(rì),2020中国5G+工业互(hù)联网大会(huì)在武(wǔ)汉开幕。习近平总(zǒng)书记向大会(huì)发来贺信,“希望湖北省(shěng)和(hé)武汉市(shì)以此次大会(huì)召开为契(qì)机,弘扬(yáng)伟大抗疫精神,大力(lì)推动数字(zì)经济发展,为推动经济(jì)高质量发展、服务构建(jiàn)新发展(zhǎn)格局作出贡献”。
8月底,我国首批(pī)8家(jiā)AI大模(mó)型产品获批名单出炉,由东湖高新区和中国科学院自动化研究所共(gòng)建(jiàn)武汉人工智能研究院打造的“紫东太初(chū)”大模型位列其中(zhōng),这也是(shì)全球首个图文音三模态大模型,曾(céng)于去年9月(yuè)荣(róng)获2022世(shì)界(jiè)人工智能大会(huì)最高奖项——SAIL大(dà)奖。
“这也意(yì)味着人工智能大(dà)模(mó)型(xíng)开始真(zhēn)正进(jìn)入大(dà)众的视野,赋能(néng)千行百业。”近日,武汉人工智能研究院(yuàn)(以下简称“武智院”)院长王金桥在接受长江日报(bào)《在(zài)场》栏目专(zhuān)访时(shí)表示,贯彻落实习近(jìn)平总书记(jì)重要指示精神,将(jiāng)坚持以(yǐ)原(yuán)始(shǐ)创新和核心技术研(yán)发为主导(dǎo),以产(chǎn)业落地为目标,促进(jìn)人工智能“走深向实”重塑千行(háng)百业。
“梦(mèng)想(xiǎng)光(guāng)谷”AI绘画创作(zuò)比(bǐ)赛(sài)优(yōu)秀获奖作品吸引了市民驻足。参赛者(zhě)依(yī)托“江城洛神(shén)”AI创(chuàng)作平(píng)台,将简短(duǎn)的(de)文本描述通过Al创作出心目中的光谷。而“江城(chéng)洛神”正是基于“紫(zǐ)东太初(chū)”大模型(xíng)打造的人工(gōng)智能内容创作平台。记者周超 摄
01
图(tú)文(wén)音三(sān)模态大模型
升级为多模态(tài)
王(wáng)金桥介绍,大模型取名“紫东太初”,一是寓意紫(zǐ)气东来、混沌初开(kāi),代表人工智能从专用迈向(xiàng)了(le)通用,从感知智能迈(mài)向了认(rèn)知智能(néng);二是“紫东”与中国科(kē)学院自动化研(yán)究所的(de)谐音相(xiàng)通,代(dài)表着自动化所(suǒ)自身的意义和使命。
3个月(yuè)前,中国科(kē)学院自动(dòng)化研究所联合武智院发(fā)布“紫(zǐ)东太初”2.0全模(mó)态(tài)大模(mó)型,该大模型是(shì)在(zài)千亿参数三模态(tài)大模型“紫东太初(chū)”1.0基础上的升级(jí),在此(cǐ)前语音、图像和文(wén)本三模态的基础上,加入了视频、信号、3D点(diǎn)云等模(mó)态数据,突破了认知增强的多(duō)模态关联(lián)等关键技(jì)术,具备全(quán)模态理解能力、生成(chéng)能力和关联能(néng)力。这意味着(zhe)在实(shí)际(jì)应用场景中(zhōng),它将能(néng)够为行(háng)业创造更大价值(zhí)。
今年以来,国内人工智能大(dà)模型(xíng)如雨(yǔ)后春笋般涌现。据不完全(quán)统计,截至今年5月,国内已扎堆发布10亿级参数规模以上基础大模型79个,“百模大战”打响。其中,绝大(dà)多数都是语言类(lèi)大模(mó)型。
“我们是国(guó)内(nèi)最早开始大模型研究的团队之(zhī)一。”王金桥介绍,得益于中国科学(xué)院自动化研究所在多模态数据领域(yù)的多(duō)年积累,团队一开(kāi)始就选择了(le)多模态大模型这条更艰难的路,实现语(yǔ)音、图像(xiàng)和(hé)文本等多种模态交叉协(xié)同与有机融合,打造更加拟人的人工智能。“在这条研发路径上,我们走在(zài)了世界前列(liè)。”他(tā)说。
在武智院的操作平(píng)台上,王(wáng)金桥给出了(le)一张奔跑的(de)小狗的照(zhào)片,“紫东太(tài)初”立(lì)刻识别并(bìng)描绘出照片中的景象:一只黑白相间的狗(gǒu)在(zài)铁轨上(shàng)奔(bēn)跑着,身后是绿色的树林。当他提(tí)出“以(yǐ)光谷为主题做(zuò)首诗”时,“紫东太初”迅速(sù)地完(wán)成了一首七言绝句。
长江日报记(jì)者注(zhù)意到,“紫东太初”被(bèi)形象(xiàng)地设计成一个身穿汉(hàn)服(fú)的(de)小女孩(hái),取名(míng)“小初”。
王金桥(qiáo)解释说,身穿汉服代表着“紫东太初”从算法(fǎ)到(dào)硬件、算力(lì)全栈(zhàn)国产化,全链条(tiáo)“中国造”;而小女孩则意味着国内的通用人工智(zhì)能还处(chù)于刚刚起(qǐ)步(bù)的阶段(duàn),“和10多岁的(de)孩子的能力差不多”。
上月举行的(de)东湖算力与大数据创新(xīn)大会上,基于“紫东太初”全模态(tài)大(dà)模型(xíng)搭建的(de)“紫(zǐ)东太(tài)初”大(dà)模型开放服务平台2.0正式发(fā)布。
该平台瞄准(zhǔn)当前人工智(zhì)能大规模应用难题(tí),将全力推动人工智能(néng)在各行业的广泛(fàn)应用,实现人工智能(néng)大模型高效落地、提(tí)升行业效率(lǜ)。
“在智能世界‘混沌(dùn)初开’之际(jì),希望‘紫东太初’的开放体验能够(gòu)为用户打开一(yī)扇探索AI未来的大门。”王金桥介(jiè)绍,该平台已(yǐ)于近(jìn)日对外开放体(tǐ)验,用(yòng)户可(kě)通过各(gè)种方式(shì)与AI进行交互,享受到(dào)更为便捷、高效的AI服务(wù)。
02
已在多个领域
形成规模化应用落地
光谷资本大(dà)厦内,中(zhōng)国光(guāng)谷人工智能AI艺术展正在展出。在(zài)现场体(tǐ)验(yàn)区,参观者只(zhī)需要输入(rù)几(jǐ)个关键词或(huò)简单(dān)的文本描(miáo)述,就能通(tōng)过“江城洛(luò)神”人工智能(néng)内(nèi)容创作(zuò)平台生成一(yī)幅幅独一无二(èr)的绘(huì)画作品,实现“妙语生画”。“人(rén)工智(zhì)能作(zuò)为一种(zhǒng)技术,和艺术有了(le)越来越多的融合。”王金桥说。
“江城洛神”正是基于“紫东太初”大模型打造的人工智(zhì)能内容创(chuàng)作平台,通过多模(mó)态(tài)技术实现图像编辑(jí)与生成(chéng),辅助内容(róng)生(shēng)产,用户无需任(rèn)何专业技(jì)能,只需(xū)轻(qīng)轻一点,便可轻松创(chuàng)造出属于自己的(de)艺术作品,可广泛运用于(yú)设计(jì)、影视、游戏等多个领域。
以室内(nèi)装修(xiū)设计领域为例,只需提供一张(zhāng)户型图(tú),“江城洛(luò)神(shén)”就可自动生成多种装修设计(jì)样式,提示(shì)词越多、越精细,生成质量就越高,还能根据(jù)不同提示自动对结果进行编辑(jí)。
两(liǎng)周前,武汉市2023年数字经济应(yīng)用场景(jǐng)“揭(jiē)榜(bǎng)挂帅”揭榜项目名单公布,“紫东(dōng)太初”大模(mó)型入选。
“‘紫东太(tài)初(chū)’大模型正赋能千(qiān)行百业,推(tuī)动数字经济全面发展。”王金桥介绍,“紫东(dōng)太初(chū)”人工智能开(kāi)放服务平台目前已成功应用(yòng)于汽车制造(zào)质检(jiǎn)、媒体信息服务、文(wén)化旅游、手(shǒu)语教育(yù)、纺(fǎng)织生产(chǎn)质(zhì)检、医疗器械等10余个领域,形成规模化(huà)应(yīng)用落地。
在智(zhì)慧医疗领域,武智院联手九州通打造基于“紫东太初”大模型的医(yī)疗器械智能管理平台,自动(dòng)识别管理(lǐ)2000多(duō)种(zhǒng)医(yī)疗器械,能效(xiào)提升30倍,精度实现99.9%,并将迅速推广到更(gèng)多医院;
在法律咨询领域,“紫东太初(chū)”大(dà)模型仅需(xū)0.5秒就可完(wán)成案件的分析、拆解、定责,将法律(lǜ)案件研判的效率提(tí)升(shēng)100倍左右;
在(zài)文化娱乐领域,“紫东太初”大(dà)模型变身“人工智能导师(shī)”,从科(kē)技角度对(duì)歌曲的审美和传播做出(chū)全新推荐,为歌唱(chàng)比(bǐ)赛参赛歌手(shǒu)们提(tí)出(chū)个性化建议……
据介绍,截(jié)至目前,武智院已与湖北三环集团、湖北港口集团、九州通(tōng)集团、光谷人(rén)才集团、武汉光庭等10余家单位在智能制(zhì)造(zào)、智能网联(lián)汽车、智慧医疗(liáo)、虚拟数字人(rén)等领域开展实质性合作,并(bìng)与东风(fēng)集团、湖北(běi)电信、湖北广(guǎng)电、长江通信、爱(ài)帝集团、集度汽(qì)车等40余家企业达成合作意(yì)向,助力数字经济与实(shí)体经济深(shēn)度融合。
“人工智能未来的10年将是AIGC(Artificial Intelligence Generated Content,即生成式(shì)人工智能(néng))的10年(nián),如果(guǒ)说(shuō)这个(gè)赛(sài)道有一万米,那么现在才刚刚跑了100米。”王金桥表示,未来,武智院还将(jiāng)围(wéi)绕更多产业打造场(chǎng)景(jǐng)化模型和垂直类模(mó)型,推动(dòng)“紫东(dōng)太初”大(dà)模型在(zài)更多领域落地应用,“并借此不断提升大模型正确知(zhī)识(shí)的(de)学习能力和生成(chéng)能力,使‘紫东太初’自身也不断地升级进(jìn)化”。