Open-AI 刚刚公布(bù)了其大(dà)型(xíng)语言模型的最新版本 ——GPT-4。
GPT-4 可以更准确地解决你(nǐ)的难(nán)题,多模态(tài)的(de) GPT-4 还可以生成(chéng)、编辑具有(yǒu)创意性或技术性的文(wén)章,在高(gāo)级推理方(fāng)面的(de)表现超(chāo)过其(qí)前(qián)辈(当前公开版(bǎn) ChatGPT 基于 GPT-3.5)。当然,正如大家所(suǒ)猜测的那样,微软 New Bing 的聊天功能确实基于(yú) GPT-4。
此外,该公司正在(zài)与(yǔ)合(hé)作伙伴 Be My Eyes 一起测试 GPT-4 的图像(xiàng)输入能力(注:Be My Eyes 是一款(kuǎn)即将推(tuī)出的智能手(shǒu)机 App,可以识(shí)别场景并对其进行描述,类似于大家常见(jiàn)的 AI 识图的加强版(bǎn))。
除了(le)介绍网站,OpenAI 还提供了描述 GPT-4 功能的技术性论(lùn)文(wén),以及详细描述其局限性的系统模型(xíng) Card。

OpenAI 计划通(tōng)过 ChatGPT 及(jí)其商业(yè) API 为(wéi)用户提供 GPT-4 的文本功能支持,但目前(qián)还需要等(děng)待。IT之家这里需要提醒(xǐng)一(yī)下,GPT4 目(mù)前仅 ChatGPT plus 账号可用,可选(xuǎn) GPT4 模式进(jìn)行对话,每 4 小时(shí)限(xiàn)制发送(sòng) 100 条消息。
收费方面,大约 750 个单词(cí)的提示收(shōu)取(qǔ)约 3 美分的(de)费用,约(yuē) 750 个(gè)单词的(de)响(xiǎng)应则收取 6 美分(就是问(wèn)和答的(de)区别(bié))。

据介绍,GPT-4 比以前的版(bǎn)本(běn)“更大”,这意味着它(tā)已经借助比前辈更多(duō)的数据进行了(le)训练,并且在模型文件中有更多(duō)的权重,从而使得它的运行成本更(gèng)高。
就任(rèn)务而言(yán),GPT-4 的表现比前辈更(gèng)好,它可(kě)以遵(zūn)循自然语言(yán)的复杂(zá)指令并(bìng)生成(chéng)技术(shù)或创意内容,而且它(tā)可以还更深入地做(zuò)到(dào)这一点:它(tā)支持(chí)生成和处理多达 32768 个标记(约 25000 个文本单词),从(cóng)而实现(xiàn)比前辈更长的内(nèi)容创建或文本分(fèn)析。
OpenAI 表示(shì),GPT-4 错(cuò)误答案更少,而且也会减少(shǎo)偏离话题(tí)的可能,也尽可能不会再谈论禁忌话题,甚至在(zài)许多(duō)标准化测试中比人(rén)类(lèi)表现得都要更(gèng)好一些。
例如,GPT-4 在模(mó)拟律师考(kǎo)试的成绩在(zài)考生中(zhōng)排名前 10% 左右,在 SAT 阅读考(kǎo)试中排名前(qián) 7% 左右,在 SAT 数(shù)学考试中排名前(qián) 11% 左右。相比之下(xià),GPT-3.5 在律师考试中的(de)得分(fèn)一般都是倒数 10% 左右。当然,它们考个研究生还是没问题的。

当然(rán),AI 毕竟是(shì) AI,OpenAI 也表示目前 GPT-4 并不(bú)完美(měi),它在很(hěn)多场景(jǐng)下(xià)的能力都(dōu)不如人类。
据称(chēng),该模型仍然存在“幻觉(jiào)”或(huò)编造事(shì)实的问题,并且在事实方面也不(bú)一(yī)定总是可靠的(de),“它倾向于坚持认为(wéi)它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局(jú)限性,例如(rú)社(shè)会偏见、幻觉和(hé)对抗(kàng)性提示。