开云

    咨询(xún)热线:021-80392549

    开云 QQ在线 开云 企业微信
    开云
    开云 资讯 > 人工智能 > 正文

    声音定制三天交付(fù),深声科(kē)技(jì)如何在语音(yīn)AI赛(sài)道弯道超车?

    2020/01/13445

    自2015年开始,中国人(rén)工智(zhì)能市(shì)场(chǎng)规模逐年攀升,2018年中国人工智(zhì)能市场(chǎng)规模约(yuē)为238.2亿元,增长率达(dá)到56.6%,据预(yù)测,到2020年,中国在人(rén)工(gōng)智能的市场(chǎng)规(guī)模将接近500亿元。

    “语音是AI智能时代的(de)重(chóng)要入口,”深(shēn)声科技创始人周俊明说。他的底气来自多(duō)年的行业积累和(hé)互联(lián)网产(chǎn)品(pǐn)开发经验(yàn)。

    2012年,周俊明从中科院计算所博士毕(bì)业,顺利进入广电行业龙头企业北京永新视博(bó)担任(rèn)高级算法工(gōng)程师,主要负责音视频算法工作;2013年(nián),他凭借(jiè)音视频算法技术(shù)能力,被腾讯选中,故任职于此,继续从事在线(xiàn)音视频(pín)算法技术研发工(gōng)作;2016年,他加入了欢聚时代,担任(rèn)音(yīn)视频技术总(zǒng)负(fù)责人,带领(lǐng)国内顶级音视(shì)频团(tuán)队,为YY提供核心技术(shù)服(fú)务和技术创新(xīn)方案。

    2018年(nián),周俊明和核(hé)心团队成(chéng)员共同创办了“深声科技”,一家智能语(yǔ)音技术服务商,主(zhǔ)要通(tōng)过基于深度学习的文字转语音整体解(jiě)决方案服务B端客户(hù),提高客户在(zài)行业(yè)内(nèi)的竞争壁垒(lěi),帮助客户形成独有的竞争优势(shì)。据悉,成立不(bú)到半年,深声科技就获得(dé)了来自(zì)小米科技的数千万元天使轮融资。

    AI行业(yè)从不缺(quē)竞争(zhēng)对手,BAT等头部大企业有(yǒu)强者的(de)打法,初创企业也有自己弯(wān)道超车的策略。深声科技在多年的(de)实践摸索发现,以(yǐ)往客(kè)户在语音合成中最关心的是信息的传递。但随着物质(zhì)生(shēng)活的(de)不(bú)断提高,客户对于语音转化真实感的需求也日(rì)益(yì)剧增,催生了拟人(rén)声智能营销、拟人互动、拟人陪伴等(děng)大规模商业化应(yīng)用(yòng)场(chǎng)景和价值(zhí)。基于此(cǐ)逻辑,深声科技在商业模式方面主(zhǔ)打三大场景:语音内容输(shū)出、智能语(yǔ)音(yīn)交(jiāo)互(hù)、智能客服营销。

    其中,内容输出业务是深(shēn)声科技(jì)重点(diǎn)推(tuī)进的(de)主线业务,团队主要通过(guò)与有版权IP的企业合作,以有声(shēng)阅读的方式将(jiāng)深声语音(yīn)呈(chéng)现给消(xiāo)费(fèi)者,内容涵盖文学、动漫、新闻资讯等(děng)多种题(tí)材和类型。根据深声科技提供(gòng)的数(shù)据显示,深声目前已与十余家(jiā)行业头部的(de)内容版权企业(yè)达(dá)成(chéng)合作,一方面为企业提供(gòng)文字语言转(zhuǎn)化工具,按字(zì)数收费;另一方面(miàn),提(tí)供(gòng)语音(yīn)合成整体(tǐ)解决方案,共同开发版权IP的语音形式。

    语音交(jiāo)互业(yè)务(wù)中,团队依托投资方(fāng)小米的资源(yuán)及产品(pǐn),重点服务智能语音音(yīn)箱和车联网企(qǐ)业,为其提供语(yǔ)音(yīn)合成、数据(jù)制作和人机交互等服务,协助客户在产品(pǐn)开发过程中精准感知用户需求,增(zēng)强行业(yè)竞争优势。

    智能客服营销(xiāo)业务(wù)是深声科技(jì)正在尝试的场景,深声科技主要帮助运营商和金融客户定制声(shēng)音并合成声音,使其在营销过程中提高通话时(shí)长和营销转化(huà)率。谈及看(kàn)好语音交互和智能客服营(yíng)销这两类(lèi)客户群体的原因时,周俊明告诉创业邦(bāng),这两类客户对于语音音质的要(yào)求更(gèng)高,通过深(shēn)声科技自身语音(yīn)合成技术的(de)优(yōu)势能很快(kuài)产生规模化(huà)效应,且这两类客户群体的长期付(fù)费(fèi)能力更强。

    从时间(jiān)的(de)维度(dù)上看,深声科技相比科大讯飞、商(shāng)汤科技等AI企业入局较晚(wǎn),但团(tuán)队正在加紧业务布局,构建自身技术壁(bì)垒(lěi)。首先,基于端到端的(de)语(yǔ)音(yīn)合(hé)成技(jì)术(shù)逻辑(jí),深声科技会对采集到的原(yuán)始语音进行自动标注(zhù),再由声(shēng)学模(mó)型(xíng)算(suàn)法对语言和语音进行音素级特征对齐,可以实现(xiàn)完全(quán)拟(nǐ)人发声,将语气、语调、语速(sù)、抑扬顿(dùn)挫等语音特点完(wán)美呈现。在Blizzard Challenge 2019 国际语音合成大赛中,该技术在PER(拼(pīn)音-不包含声调-错误率)和PTER(拼(pīn)音-包含声调-错误率)两个指(zhǐ)标上优于科大讯飞。此外,团队在声音(yīn)定制合成方面的交付能力突出,三(sān)天内便可完成,而行业(yè)一般需要3~6个月。

    成立不到(dào)两年,团(tuán)队已有50多人(rén)规(guī)模,其中80%为技术(shù)研发(fā)人员。团队主要成员拥有中科院、中山大学、华(huá)南(nán)理工(gōng)、日本早稻田大(dà)学等名(míng)校硕(shuò)博教育背景和腾讯、网易(yì)、YY等名企工(gōng)作(zuò)经历。联合创始人黄博贤(xián)拥有(yǒu)12年的(de)互联网语音和(hé)音频技术积累,先后在酷狗和YY主导语音和(hé)音频技术的开发。

    接下来,团队会重点在效果、性能、数(shù)据三个维度优化算法技术,为各行各业提供更(gèng)多标准化解决方案,加速技术落地,同时完(wán)善(shàn)智(zhì)能语(yǔ)音交互(hù)全链路技术。2020年,团队(duì)还(hái)将推出(chū)面向C端用户的语音克隆产品,在(zài)陪伴、亲子互动、泛娱乐等交互场景(jǐng)全面发力。

    目前,该项(xiàng)目已启动A轮融(róng)资,资金将全部(bù)用于(yú)团队(duì)建设及业(yè)务拓展。

    本文相关的文章列表页头(tóu)图(tú)图片(piàn)来源于摄图网(wǎng),经授权使用。本文为创业邦原创,未(wèi)经授权不得(dé)转载(zǎi),否则创业(yè)邦将保留向(xiàng)其追究法律责(zé)任的权利。如需转载或有任何疑问(wèn),请联系。

    关键词:




    AI人工智能网(wǎng)声明:

    凡资讯来源注明为(wéi)其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表(biǎo)本网站(zhàn)对其真实性负责。您若对该文(wén)章(zhāng)内容有任何疑问(wèn)或质疑,请(qǐng)立(lì)即与网站(www.zhuzhou.jiaxing.zz.pingliang.ww38.viennacitytours.com)联系,本网站(zhàn)将迅速给(gěi)您回(huí)应并做处理。


    联系电话:021-31666777   新闻(wén)、技术(shù)文章投(tóu)稿QQ:3267146135   投稿邮箱(xiāng):syy@gongboshi.com

    精选资讯更多(duō)

    相关资讯更多

    热门搜索

    工博(bó)士人工智能网
    开云
    扫描二维码关注微(wēi)信
    扫码反馈

    扫一扫,反馈当前页面

    咨询(xún)反馈
    扫码关注(zhù)

    微信公(gōng)众号

    返回顶部(bù)

    开云

    开云

    相关信息

    "开云 开云咨询为企业提供一站式企业咨询服务。

    更新时间:2025-07-17 08:14 来源:zhuzhou.jiaxing.zz.pingliang.ww38.viennacitytours.com