想(xiǎng)象一下,星团、星云和其他(tā)星际现象都是(shì)由计算机在无人监督(dū)的(de)情况下(xià)凭空生成的。这(zhè)听起来可能像是对未来(lái)全息技术(shù)的描述,但是(shì)爱丁堡大学(xué)感知研究所和天文学研究所(suǒ)的研究人(rén)员,就在人工智(zhì)能(néng)的帮助下设(shè)计了这样一个系(xì)统(tǒng)。
研(yán)究人员描述(shù)了一种人(rén)工智(zhì)能模型,该模型能够生成合成星系的高分辨(biàn)率图像,这些图像遵循了(le)真实的(de)星系(xì)分布。
“21世(shì)纪的(de)天文学发现自己拥有大量(liàng)数据,大(dà)部分(fèn)数据在捕获时会被过(guò)滤掉,以节省内(nèi)存存储,”他们写道。“对于深度学习等现代(dài)技术来说,进入这一(yī)领(lǐng)域的时(shí)机已经成熟。星系在(zài)这类应用中起了关键作用,我们探索了利用人工智(zhì)能来生成星(xīng)系图像的可能性。”
该团队机器学习(xí)架构(gòu)的(de)核心是生成对抗性网络(GAN)——由生成样(yàng)本的生成器(qì)和试图区分生(shēng)成样本和真实样本的(de)鉴(jiàn)别(bié)器组成的两部分(fèn)神(shén)经网络。将GAN描述为AI算(suàn)法中的“神(shén)童(tóng)”并不夸(kuā)张;它(tā)们被用(yòng)来(lái)发现新药,制作(zuò)令人信服的汉堡和蝴蝶照片,甚至生成(chéng)脑癌(ái)的(de)人(rén)工(gōng)扫描图。
这一星系生成系统由(yóu)两个五层GANs组成:阶段一(yī)GAN和(hé)阶段二GAN。第一个生成(chéng)低分辨率(lǜ)图像(64x64像素),而第二个使(shǐ)用一种叫做超分辨率的技术(shù)将它们转换成高分辨率图(tú)像(128x128像素)。研究人员指出,在实际过程中(zhōng),阶段二GAN会自我填充缺失(shī)的像素,更加注重现实性而非准确性。
为了“鼓励”阶段二GAN中(zhōng)的(de)生成(chéng)器(qì)生(shēng)成类似于(yú)放大实像对应物(wù)的(de)合成星系图(tú)像,该论文作者引(yǐn)入了一个“双目标(biāo)函数(shù)”,该(gāi)函数计算(suàn)了分辨率(lǜ)增强图像和实像之间(jiān)的误差标准。其结果是生成(chéng)了(le)大量保留(liú)星系“更稀(xī)有”特征的样本,如旋臂。
研究人员使用(yòng)英伟达GTX 1060 GPU在PC上训练人工智(zhì)能系统,并为(wéi)其提供来自Galaxy Zoo 2数据集的恒星(xīng)和(hé)行星体的(de)全色图像,Galaxy Zoo 2是一个(gè)众(zhòng)包(bāo)天文学项目。他们在评估(gū)结(jié)果时考虑了四个属(shǔ)性:椭圆度,或偏离圆形度(dù)的程(chéng)度;与水平面(miàn)的仰角;总流(liú)量;以及半长轴(zhóu)(椭(tuǒ)圆(yuán)最长直(zhí)径的(de)一(yī)半)的尺寸测量。
在论文的最后,研究人员写道,该模型(xíng)生成了非常类似真实星系“物理(lǐ)真实”的图像(xiàng)。他们(men)认为(wéi),这一系统可以被用来扩充真实样本的(de)数据库(kù),实际上这也是深(shēn)度学习模型的数据源。
“能够创建物理真(zhēn)实的星系(xì)图像(xiàng)生(shēng)成模型(xíng)有许多实(shí)际用途,”他们写道。“我们的工作展示了GAN架构(gòu)作为现(xiàn)代(dài)天文学(xué)宝贵工具的潜力。”