开云

    咨(zī)询(xún)热线:021-80392549

    开云 QQ在线 开云 企业微信
    开云
    开云 资讯(xùn) > 人(rén)工智能 > 正文

    让(ràng)AI认出「生狗」Facebook构建能感知变(biàn)化算子的人工智(zhì)能

    2021/03/23新(xīn)智元463

    一条狗,即使是之前从未见过的品(pǐn)种(zhǒng)、颜色(sè),我们也能(néng)一眼认出它。

    对(duì)周遭任何变化的感知是人(rén)类与生俱来的能力。

    但是人工智能系统(tǒng)就(jiù)不(bú)一样了(le),即(jí)使级别SOTA,能完(wán)成无数(shù)人类(lèi)完(wán)成不了的任务,但也有(yǒu)很多(duō)对人(rén)类来说轻(qīng)而易举的事情,它却搞(gǎo)不定,比如,让金(jīn)毛换个角度:正面、侧面、前(qián)面、后面(miàn),人工(gōng)智能(néng)可能(néng)会识(shí)别地很挣扎。

    深度学习模(mó)型擅长解释像素和标签之(zhī)间的统计模式,但却很难通过许(xǔ)多潜在的自然(rán)变化(huà)正(zhèng)确识别对(duì)象。

    那是扫雪机(jī)在(zài)路上扫雪吗?还是一辆校车侧翻了?

    上图是根据(jù)M.A. Alcorn等人的(de) "Strike(with)a pose: Neural networks are easily fooled by strange poses of familiar objects"绘制,显示了一个(gè)深度神经网络将一辆(liàng)公(gōng)共汽(qì)车错误(wù)地分类为扫雪(xuě)车(chē)。

    人类可以(yǐ)瞬(shùn)间知道(dào),但是颜色、大(dà)小和透视等因(yīn)素使情(qíng)况复杂化,增加了人工智能模型的预测难度。

    Facebook AI一直在(zài)探索(suǒ)如何(hé)更(gèng)好地捕捉自然变(biàn)化,在这方面,传统解决(jué)方(fāng)案有很大局限性,即所谓的解(jiě)纠缠(chán)(disentanglement)。我(wǒ)们最近(jìn)还提出(chū)了(le)等(děng)变化移位算子(equivariant shift operator)的(de)概念,这是一种替代解的概念证明,可以帮助模型理解通过(guò)模拟最常见(jiàn)的变换,物体可(kě)能会发生怎样(yàng)的变化。

    目前,Facebook AI在这方面的工(gōng)作主要(yào)是(shì)理论性的,但是对于深度学习模型,特别是计算机视觉潜力巨大: 增加了可解释性(xìng)和准(zhǔn)确性,即使(shǐ)在小数据(jù)集(jí)上训练也有更好的(de)性能,并提高了泛化能力。Facebook AI希(xī)望(wàng)这些贡献能够使(shǐ)计算机视觉向前推进(jìn)一步,更好地理(lǐ)解视觉世界的复杂性。

    现行方法的局限

    目前(qián)的解纠缠方(fāng)法试图通过将(jiāng)模型中的每(měi)个因子编码到模型内部表(biǎo)示的一个(gè)单独的(de)子空间中,来(lái)学习模型中对象的基本变换。

    例如,解纠缠可能将狗图像的数(shù)据集(jí)编(biān)码为姿态、颜色(sè)和(hé)品种子空间。

    这种方法(fǎ)在识别刚性数据集的(de)变化因素方面很有优势(shì),比如一个单一的 MNIST 数字或者一个单一的对象,比如(rú)一把椅子,但是我们已经发现,在多个分(fèn)类(lèi)中,解纠缠的(de)表现很(hěn)差。

    想象一(yī)下多个旋转的形状,比(bǐ)如三角形和正方(fāng)形(xíng)。解纠缠模型试图将物体的形状和方向这两个变化(huà)因素分离成两个变化因素。

    下图说明了传(chuán)统的解纠(jiū)缠是无法在多个形状的数据集中孤立旋转的。我(wǒ)们期望(wàng)高亮显示的形状(zhuàng)会旋转,但是由于解纠缠失败,形状仍然(rán)是固定(dìng)的。

    解纠缠还带来了(le)拓扑缺陷,这是一系列众多变(biàn)换中(zhōng)的(de)另(lìng)一个问题。拓扑缺陷违(wéi)背连续(xù)性(xìng)——深度(dù)学习模型的本质属(shǔ)性。如果没有连(lián)续性,深度学习模型可能很难有效地学习(xí)数(shù)据中(zhōng)的模式。

    想(xiǎng)象一下正三角形(xíng)的旋转。旋转120度的(de)正三角形与原来的三角形无法区分,导致在方向空间中有相(xiàng)同的表示(shì)。然而(ér),通过在三角形的一个角上加一个(gè)无穷小的点(diǎn),表示变得(dé)可辨别,违反了连(lián)续性(xìng)。附(fù)近的图像映射到相距较(jiào)远的图(tú)像。Facebook AI的研究还表(biǎo)明,拓扑缺陷出现(xiàn)在(zài)非对称(chēng)形(xíng)状(zhuàng)和许多(duō)其他常(cháng)见(jiàn)的(de)变换中。

    利用等变化(huà)算子揭示变化因子

     

    有一个数学分支「群论」可以教(jiāo)我们应用(yòng)等(děng)变化算子的很多知识。它表(biǎo)明(míng),一个(gè)直(zhí)观的方式来理(lǐ)解变化因素是将他们模拟为一组(zǔ)转(zhuǎn)换。例如(rú),一个三角(jiǎo)形的旋转有一个组的结构: 90度旋转和30度旋(xuán)转(zhuǎn)结合起来产生120度旋(xuán)转。

    Facebook AI利(lì)用这些想法(fǎ)来识别传统(tǒng)解(jiě)纠(jiū)缠的缺点,并确定(dìng)如何训练等变化算子来解纠缠。我们提出了一个等变化算子,称为移位算子。这是(shì)一个矩阵,其块体模仿了常(cháng)见变换的组结构--旋转、平(píng)移和(hé)重缩放。然后在原始图像和它们的转换(huàn)上训练一个人工智能模型。

    这样(yàng)就会发现(xiàn),即使在包含多个类的数据集中,移位算(suàn)子也能(néng)成功地学习变换(huàn)--这正是传统解纠缠经常失败的(de)条件。

    关键词:




    AI人工(gōng)智能网(wǎng)声明:

    凡资讯来源(yuán)注明为(wéi)其他媒(méi)体来源的信息(xī),均为(wéi)转(zhuǎn)载自(zì)其他(tā)媒体,并不代(dài)表本(běn)网站(zhàn)赞(zàn)同其观点,也不代(dài)表本网站对其真实性(xìng)负责。您(nín)若对该(gāi)文章内(nèi)容有任何疑问或质(zhì)疑,请立即与网站(www.zhuzhou.jiaxing.zz.pingliang.ww38.viennacitytours.com)联(lián)系,本网(wǎng)站将迅速给您(nín)回应并(bìng)做处理(lǐ)。


    联系电话(huà):021-31666777   新(xīn)闻(wén)、技术文章投稿QQ:3267146135   投稿邮箱:syy@gongboshi.com

    精选资(zī)讯更多

    相关资(zī)讯更多

    热门搜索

    工博士人工智能网
    开云
    扫(sǎo)描二维码关注微信
    扫码反馈

    扫一扫,反馈当前页面

    咨询(xún)反馈(kuì)
    扫码关注

    微信公(gōng)众(zhòng)号

    返回顶部

    开云

    开云

    相关信息

    "开云 开云咨询为企业提供一站式企业咨询服务。

    更新时间:2025-07-16 15:48 来源:www.zhuzhou.jiaxing.zz.pingliang.ww38.viennacitytours.com