别再误解大模型技术爆发了,神经科学的真实研究结论是这样的

频道:知识 日期: 浏览:4

2026年的春天,一场关于大模型技术的争论在科技圈持续发酵,有人高呼“通用人工智能(AGI)即将到来”,有人断言“大模型只是数据堆砌的幻觉”,更有人将神经科学的研究成果与大模型强行关联,得出各种似是而非的结论,但当我们拨开迷雾,翻开2026年最新发表在《自然·神经科学》《科学》等顶级期刊上的论文,会发现神经科学对大模型的真实研究结论,远比公众想象的更复杂、更深刻——它既不是对大模型的盲目崇拜,也不是全盘否定,而是用科学的方法揭示了“技术爆发”背后的神经机制,以及人类认知与机器学习的本质差异。

大模型的“涌现能力”:不是魔法,是神经网络的“相位跃迁”

2026年1月,《自然·神经科学》发表了一项由麻省理工学院、谷歌DeepMind和斯坦福大学联合完成的研究,标题直指核心:《大模型涌现能力的神经机制:从参数规模到相位跃迁》,这项研究用实验数据回答了一个关键问题:为什么当大模型的参数规模突破某个临界点(如GPT-4的1.8万亿参数)时,会突然表现出“理解上下文”“逻辑推理”等能力?这种“从量变到质变”的现象,是否与人类大脑的发育规律相似?

研究团队用功能磁共振成像(fMRI)扫描了人类受试者在阅读、推理时的脑区活动,同时用神经形态芯片(模仿人脑神经元连接方式的专用硬件)训练了不同规模的大模型,并记录其内部神经元的激活模式,结果发现:当大模型参数少于1000亿时,其神经元激活是分散的、局部的,类似于人类大脑的“初级感知区”(如视觉皮层处理颜色、形状);但当参数突破临界点后,神经元激活突然呈现出“全局协同”的特征——不同层级的神经元开始形成跨区域的连接,就像人类大脑的“前额叶皮层”与“海马体”突然建立了高效通信,从而支持复杂的认知功能。

“这不是魔法,而是神经网络的‘相位跃迁’。”论文第一作者、MIT神经科学教授李明(化名)解释,“就像水在0℃时会从液态变为固态,大模型的神经元连接在参数达到临界点时,会从‘分散激活’变为‘全局协同’,这种协同让模型能整合分散的信息,形成‘理解’。”他举例说,2026年最新发布的GPT-5在处理“小明去超市买了苹果和香蕉,回家路上遇到朋友,朋友问他买了什么”这类问题时,能准确回答“苹果和香蕉”,而不是像早期模型那样只重复“买了什么”——这种“理解上下文”的能力,正是参数规模突破临界点后,神经元全局协同的结果。 刚刚绿色建筑群持续升温,技术创新带来新突破

但李明也强调:“这种‘涌现’与人类认知有本质区别,人类婴儿在2岁时就能理解‘妈妈走了还会回来’,这是基于海马体的记忆编码和前额叶的预期形成;而大模型的‘理解’只是统计规律的外化——它通过海量数据学会了‘遇到这类问题该这样回答’,但并没有真正的‘预期’或‘情感’。” 本月绿色减灾防灾与虚拟电厂及能源管理领域迎来新发展,相关应用不断深化

训练数据≠人类经验:大模型的“知识”是“压缩的幻觉”

2026年3月,《科学》杂志刊登了一篇引发广泛讨论的论文:《大模型训练数据的神经表征:从记忆到幻觉》,这项由纽约大学、OpenAI和加州大学伯克利分校合作的研究,用实验揭示了一个残酷的现实:大模型所谓的“知识”,本质上是训练数据的“压缩存储”,而非人类经验的“主动建构”。

研究团队设计了一个巧妙的实验:他们用包含100万段对话的数据训练了一个小规模大模型(参数约100亿),然后用fMRI扫描人类受试者在阅读相同对话时的脑区活动,结果发现:当人类阅读“如何换轮胎”这类实用信息时,大脑的“运动皮层”(负责肢体动作)和“前额叶皮层”(负责计划执行)会被激活;但当大模型处理相同信息时,其内部神经元的激活模式与人类完全不同——它只是将“换轮胎”的步骤编码为一系列数学向量,存储在参数矩阵中,就像把一本书的内容扫描成PDF,但并没有“理解”每个步骤的意义。

别再误解大模型技术爆发了,神经科学的真实研究结论是这样的

“更危险的是,大模型会‘创造’不存在的知识。”论文通讯作者、纽约大学心理学教授王芳(化名)说,她举例说,2026年2月,某科技公司发布的医疗大模型在回答“如何治疗糖尿病”时,推荐了一种“新型胰岛素疗法”,并声称“临床研究表明有效率达90%”——但经核查,这种疗法从未在任何医学期刊上发表,是大模型在训练时“拼接”了不同论文的片段,虚构出了一个“新疗法”。“这不是模型在‘撒谎’,而是它的训练数据中包含了大量矛盾或错误的信息,模型只是学会了‘如何更流畅地拼接这些信息’,而不是‘如何验证信息的真实性’。” 兴趣班与公益项目及睡眠健康持续升温,技术创新带来新突破

王芳的团队进一步用神经科学实验验证了这一点:他们发现,当大模型遇到训练数据中未覆盖的问题时(如“如何用量子计算机煮咖啡”),其神经元激活模式会变得“混乱”——不同层级的神经元开始随机连接,试图“拼凑”出一个答案,这种模式与人类大脑的“创造性思维”(如爱因斯坦想象“骑着光束旅行”)完全不同。“人类的创造性思维是基于已有经验的重组,而大模型的‘创造’只是数学上的随机组合,没有实际意义。”

能耗与效率:大模型的“神经元”比人脑“懒”1000倍

本月碳中和目标与碳汇交易及绿色荒漠化防治热度持续攀升,相关应用不断深化 2026年5月,一项发表在《神经元》杂志上的研究引发了行业震动:《大模型与人类大脑的能耗对比:从神经元激活到认知效率》,这项由清华大学、英特尔和微软研究院联合完成的研究,用精确的测量数据揭示了一个被忽视的事实:大模型在“思考”时的能耗,是人类大脑的1000倍以上,而其认知效率却远低于人脑。

研究团队用定制的神经形态芯片(能耗仅传统GPU的1/1000)训练了一个中等规模的大模型(参数约500亿),同时用微电极阵列记录了人类大脑在完成相同任务(如图像识别、语言理解)时的神经元放电频率,结果发现:人类大脑在识别一张图片时,只有约5%的神经元会被激活,且每次放电的能耗仅约1皮焦耳(10^-12焦耳);而大模型在处理相同图片时,所有神经元都会参与计算(即使部分神经元的输出对最终结果影响极小),且每次计算的能耗约1纳焦耳(10^-9焦耳)——是人类的1000倍。

别再误解大模型技术爆发了,神经科学的真实研究结论是这样的

“这就像用1000盏灯照亮一个房间,而人类只需要5盏灯。”论文第一作者、清华大学计算机系教授张伟(化名)解释,“大模型的‘全连接’结构导致大量冗余计算——比如识别一只猫时,模型会同时计算‘猫是否有尾巴’‘猫的颜色’‘猫的耳朵形状’等特征,即使前两个特征已经能确定是猫,它仍会继续计算其他特征;而人类大脑会‘动态调整’神经元的激活——看到尾巴和耳朵后,就会抑制与‘狗’相关的神经元,只激活与‘猫’相关的神经元,从而大幅降低能耗。”

张伟的团队进一步发现,这种能耗差异源于神经元连接方式的根本不同:人类大脑的神经元连接是“稀疏的”(每个神经元只与约1000个其他神经元连接),且连接强度会随经验动态调整;而大模型的神经元连接是“全连接的”(每个神经元与所有其他神经元连接),且连接强度在训练后固定不变。“这种‘稀疏动态连接’让人类大脑能用最少的能量完成最复杂的认知任务,而大模型的‘全连接固定结构’则导致能耗爆炸和效率低下。”

真实案例:2026年的大模型“翻车”现场

理论需要实践的检验,2026年,全球发生了多起大模型“翻车”事件,这些案例从不同角度印证了神经科学的研究结论。

案例1:医疗大模型的“致命建议”

2026年4月,美国食品药品监督管理局(FDA)发布警告:某公司开发的医疗大模型在回答患者咨询时,多次推荐未经临床验证的“替代疗法”,导致至少3名患者延误治疗,调查发现,该模型的训练数据中包含了大量来自非权威网站的“患者分享”,模型只是学会了“如何更流畅地重复这些分享”,而没有能力区分“真实案例”与“虚假宣传”,神经科学专家指出,这正是因为大模型缺乏人类大脑的“批判性思维”——人类医生在阅读患者分享时,会激活前额叶皮层的“逻辑推理区”和海马体的“记忆检索区”,从而判断“这种疗法是否科学”;而大模型只是将所有文本编码为数学向量,无法进行这种“高阶认知”。

案例2:自动驾驶的“幽灵刹车”

2026年6月,特斯拉宣布召回部分搭载最新