AI项(xiàng)目(mù)建设规划的起点是“界定应用场景”,简单地说(shuō),如何将传统(tǒng)的做法用AI来解决。从企(qǐ)业运营(yíng)管理(lǐ)层面(miàn)来讲,企业关注的无非是“增加收(shōu)益(yì)、减少(shǎo)成本、提高效率、规避(bì)风险(xiǎn)”等四大(dà)诉求,所以AI项目对应的应用(yòng)场景也(yě)不(bú)会(huì)脱离(lí)这四大诉(sù)求,只不过(guò)需要懂业务的人(rén)员与AI咨询(xún)顾问一起在(zài)这四大诉求(qiú)范畴内,梳理出容易实现的应用(yòng)需求点,而(ér)后予以(yǐ)清晰界定。AI项目应用场景界(jiè)定(dìng)过程就项目界定(dìng)目标(biāo)、界定要解决什么问题的过程(chéng),同时关乎对AI技(jì)术的选型问(wèn)题,即如何选(xuǎn)择相应(yīng)的算法或AI实现技术(shù)方法。
AI项(xiàng)目面临的挑战就是算法的问题(tí),广义来讲就是(shì)选(xuǎn)择(zé)哪种AI实现的方法。AI实现的方法有三种:知识图谱、深(shēn)度学习、增强学习(xí)。大家通常所说的“算法”是(shì)指“深度学习(xí)”和“增强学习”。所以采用“AI实现方法”不会(huì)引起歧义(yì)。
之所以“AI实(shí)现方法(fǎ)”的(de)选择(zé),是AI项目建设的挑战,是因为,许多(duō)企业在建设AI项目时(shí)候使用(yòng)了不合适的(de)方法而造成项目失败(bài),比(bǐ)如过去两年银行业采用(yòng)深度学习的方法,来建设“金融风控”系统,其效果(guǒ)并没有(yǒu)得到很好的(de)体现,现在才意识到构建“智能风控系统”,知识图谱才是最为合适的(de)。再比如(rú),实现无人驾驶,必须选择(zé)“增强学习算法”为核心的方法(fǎ)。
一般来讲深(shēn)度学习(xí)在处理基于特征感知、识别和判断等(děng)方面表现突出,能帮助(zhù)构建聪明的(de)AI,如人脸识别、语音(yīn)识(shí)别、故(gù)障分析(xī)、客户画像(xiàng)、时序预测等;而知识(shí)图谱在(zài)模拟(nǐ)人的思考过程、处理常识(shí)知识和(hé)推理,以及理(lǐ)解(jiě)人的语言(yán)方面表(biǎo)现的更加突(tū)出(chū),如智能推(tuī)荐、智能解释、智能搜索、智能(néng)推理分析等。
“AI实现的(de)方法”没有选(xuǎn)好,整个项目就可能面临的失(shī)败风险,而(ér)且方法的选择是以业务场景界定为前提,同时还(hái)需要借助高水平的(de)AI咨询顾问,还要考虑到实现难以程度、成本预算承受能力等(děng)等,所以AI实现方法也算(suàn)是一种(zhǒng)大挑战。
目前有一(yī)种一劳永逸(yì)的方法,就是在企业部署“算法平台”(也叫(jiào)“智能(néng)中台”或企业大脑),犹如(rú)传统信息化时(shí)代ERP一(yī)样,成为大企(qǐ)业的基础标配,其中包(bāo)括了实现人工智能的三种方法(fǎ)。比(bǐ)如公安系统,按照“数据本(běn)地化、算(suàn)法本地化、应用本地化(huà)”的原则,部署了“公安大脑(nǎo)”,其(qí)中揽括了AI实现的三大方法。
才是数据问题(tí)。所(suǒ)有的AI项目都是以(yǐ)“数据”为基础的(de),人工智能之所(suǒ)以能够在近几年(nián)得以重生,就(jiù)是由于“大数据”的(de)爆(bào)发。这不(bú)难理解,就当机器人是人类(lèi)的一(yī)个特(tè)殊种(zhǒng)族,“知识(shí)就是力量”同样(yàng)可以适合于机器人,人之所以要(yào)读书、要学习,就是为了获(huò)取知(zhī)识(shí)以便能(néng)够应付各种各(gè)样的问题。
对应(yīng)到机器人,只有当(dāng)机器人(rén)吸收了大量的样本化、结构(gòu)化的数据,再借助AI实现方法(深(shēn)度学习(xí)、知识(shí)图(tú)谱(pǔ)、增(zēng)强学习),才能模仿人脑思维(wéi)和(hé)判断(duàn),如(rú)人脸识别、语(yǔ)音(yīn)识别、智能推(tuī)荐、无人驾驶等等。
而且不同的AI实现方法,采用的数据策略是(shì)不一样,包(bāo)括数(shù)据存储类型(xíng)、数据表示方式、数(shù)据处理方式(shì)则完全不一样。比如,如果使用知(zhī)识图(tú)谱(pǔ),那(nà)么必须(xū)将关(guān)系型数据进行(háng)抽(chōu)取加工、融(róng)合,以(yǐ)图形/图谱形式存储、表(biǎo)示和计算(suàn),也(yě)就是(shì)我们经常说的“图计算”。
一般来讲,企(qǐ)业如果要启动(dòng)AI项目,就要做好三(sān)种数据库(kù)的准备,即(jí)“传统(tǒng)的关系型数据库”、“时序(xù)数据(jù)库”和“图谱数(shù)据库”,而且(qiě)对数据的收集、处理、加工(gōng)、规范则是与时俱进,不(bú)能停(tíng)顿。要(yào)说人工智能成本花在哪里,至少(shǎo)70%以上(shàng)在数据方面。不但要求数据有(yǒu)量,还有质量和表示形式的要求,这跟(gēn)做菜一样,需要有(yǒu)足够(gòu)的食(shí)材原料(liào),而且原料质量(liàng)要够(gòu)好,原料加工成食材(cái)要符合烹饪等等,再配合大厨的煎炸焖炒炖等手法(fǎ)(算法)和火(huǒ)力(算力),才能搞(gǎo)出一桌好(hǎo)菜。