近日,阿里巴巴公开一项(xiàng)“语音识别方法及(jí)装置(zhì)”相(xiàng)关专利,该专利于2019年7月4日申请,2021年1月22日公开,公开号为CN112259089A。
根据专利摘(zhāi)要(yào),本申请实施例提供(gòng)了一种语音(yīn)识别方法及装(zhuāng)置(zhì),涉及人工(gōng)智(zhì)能领域。其中,所述方法包括(kuò):获取第一音(yīn)频样本的音(yīn)频(pín)数据帧与第一音(yīn)频样本(běn)对应的文本标注数据的上下文相关音素的第一强制对齐结果;基于(yú)第一(yī)强(qiáng)制(zhì)对齐结果,确定第(dì)一音频样本的音频数(shù)据帧关于待训(xùn)练的唤醒声(shēng)学(xué)模型的音素标注数据;基于(yú)音素标注数(shù)据,对待训练的唤醒声学模型进行训练(liàn),其(qí)中,唤醒(xǐng)声(shēng)学(xué)模型的输(shū)出层中设置有针(zhēn)对唤醒词的唤醒词相关(guān)输出部(bù)分和唤醒词无(wú)关输出部分。
通(tōng)过本申请实(shí)施例,使得训练后(hòu)的唤醒(xǐng)声学模型在兼顾语音唤醒性能的(de)同时(shí),能够有效降低对设备端的计(jì)算(suàn)资源的使用。
阿(ā)里巴巴的这项专利很有(yǒu)可能用(yòng)在智能设备上,如智能音响。2017年7月(yuè)5日,阿里巴巴集(jí)团阿里(lǐ)云智能(néng)事业群(qún)推出AI智能终端(duān)品牌(pái)——天猫精灵,让用户以自然语言对话(huà)的交互方式,实(shí)现(xiàn)影音娱乐、购(gòu)物、信息查询、生活服务等功(gōng)能(néng)操作,成为作为消费者的(de)家庭助手。
去年5月,在(zài)天猫(māo)精灵发布会上,提出(chū)了“双百(bǎi)计划(huá)”,即将投入 100亿元(yuán)进行生态(tài)建设,与合作伙伴(bàn)共同推出 100 款(kuǎn)千万级智能产品。