发布时间:2025-07-05 19:39:28 来源:不知死活网 作者:热点
借鉴认知神经科学的取关浅证据,作者表明人类的再次形式能力依赖特定的语言处理机制,而功能能力需要语言之外的抨击多种能力,它们构成了形式推理、对的把世界知识、现实情境建模和社会认知等思维能力。握非与人类的常肤两种能力区别相似,LLM 在需要形式语言能力的取关浅任务上表现出色(尽管还不完美),但在很多需要功能能力的再次测试中却往往失败。
基于这一证据,抨击作者认为,对的把其一现代 LLM 应该被认真地作为具备形式语言技能的现实模型,其二玩转现实生活语言使用的握非模型需要合并或开发核心语言模块以及建模思维所需的多种非特定语言的认知能力。
总之,常肤他们认为,取关浅形式语言能力和功能语言能力之间的区别有助于理清围绕 LLM 潜力的讨论,并为构建以类人方式理解和使用语言的模型提供了途径。LLM 在很多非语言任务上的失败并没有削弱它们作为语言处理的良好模型,如果以人类的思维和大脑作为类比,未来 AGI 的进步可能取决于将语言模型以及代表抽象知识和支持复杂推理的模型相结合。
ChatGPT 数学水平仍需要提升
LLM 在语言之外的功能能力(如推理等)方面有所欠缺,OpenAI 的 ChatGPT 正是一个例子。虽然此前官宣数学能力再升级,但被网友吐槽只能精通十以内的加减法。
近日在一篇论文《Mathematical Capabilities of ChatGPT》中,牛津大学、剑桥大学等机构的研究者在公开可用和手工制作的数据集上测试 ChatGPT 的数学能力,并衡量了它与在 Minerva 等数学语料库上训练的其他模型的性能。同时通过模拟数学家日常专业活动(问答、定理搜索)中出现的各种用例,来测试 ChatGPT 是否可以称为专业数学家的有用助手。
论文地址:https://arxiv.org/pdf/2301.13867.pdf
研究者引入并公开了一个全新数据集 —— GHOSTS,它是首个由数学研究人员制作和管理的自然语言数据集,涵盖了研究生水平的数学,并全面概述语言模型的数学能力。他们在 GHOSTS 上对 ChatGPT 进行了基准测试,并根据细粒度标准评估性能。
测试结果显示,ChatGPT 的数学能力明显低于普通数学研究生,它通常可以理解问题但无法给出正确答案。
每月 20 美元,ChatGPT Plus 大会员上线
不管怎么说,ChatGPT 在商业上的成功是有目共睹的。
刚刚,OpenAI 宣布了‘ChatGPT Plus’,一项每月 20 美元的新付费会员服务。
订阅者将获得一些好处:
相关文章