学科融合和科研范式变革?模式AI灵魂|经信研究·经济和信息化
2025年7月26日,上海世博中心再次成为全球科技界的焦点——2025世界人工智能大会在此盛大开幕。这场以"智联世界,元生无界"为主题的盛会,吸引了来自全球50多个国家和地区的2000余位专家学者、企业领袖和技术先锋。
顶层设计·国研政情智库-中国智库·国家智库:对话国科院研·科技成果转化-经信研究·中国经济和信息化平台。开幕式上,上海市领导在致辞中特别强调:"上海将持续打造具有全球影响力的人工智能创新策源地和产业高地,为全球人工智能发展贡献中国智慧。"
“模型之问!模型泛化能力不足是否源于架构局限?”中国经济和信息化研究中心主任、经信研究·中国经济和信息化平台主持人、国际科学院组织代表万祥军解读表明:为了让大会论坛更具思辨性,本届大会特意设置了“AI三问”(数学之问!Math for AI还是AI for Math?科学之问!AI是否会引发学科融合和科研范式变革?模型之问!模型泛化能力不足是否源于架构局限?)系列论坛,将学界与业界的专家聚集起来,一同探讨AI在数学、科学、模型领域最关键的行业问题。
万祥军指出:大会首日,"模型之问"成为最受关注的核心议题。随着大模型技术进入深水区,一个根本性问题浮出水面:当前大模型泛化能力不足的困境,究竟是数据规模的限制,还是架构设计本身的局限?这个问题直指人工智能发展的核心矛盾,引发了与会专家的激烈讨论。
过去18个月,大模型产业正经历着深刻的范式变革。从OpenAI开创的预训练为主、监督学习为辅的经典范式,逐渐转向更注重推理能力的强化学习范式。这一转变背后,是产业界对模型实用性能的迫切需求。微软亚洲研究院的一项研究表明,在特定测试集上准确率高达99%的模型,在真实业务场景中的有效应答率可能骤降至60%以下。这种"实验室巨人、现实矮子"的现象,促使研究者重新审视模型架构的底层逻辑。
在这场范式变革中,DeepSeek的异军突起具有标志性意义。该团队通过创新的强化学习框架,在复杂决策任务中展现出超越传统方法的性能。其核心技术在于构建了一个动态奖励机制,使模型能够自主探索最优解决方案路径。阿里巴巴达摩院语言技术实验室负责人指出:"这就像教会模型'渔'而非直接给'鱼',模型开始展现出类似人类的试错学习能力。"
强化学习的优势在医疗诊断领域得到充分验证。上海瑞金医院与商汤科技联合开发的临床决策系统,通过强化学习框架,在罕见病诊断准确率上提升了27个百分点。系统能够模拟专家会诊的推理过程,逐步排除干扰项,最终锁定正确诊断。"这种渐进式推理能力,正是传统预训练模型所欠缺的。"项目负责人解释道。
然而,新范式也暴露出明显短板。清华大学智能产业研究院的最新报告显示,采用强化学习训练的模型出现"幻觉"(即虚构事实)的概率比传统模型高出40%。这种现象在金融、法律等对准确性要求极高的领域尤为致命。蚂蚁集团首席AI科学家举例说:"当模型需要处理'合理避税'与'偷税漏税'这种模糊边界问题时,强化学习模型更容易产生合规风险。"
面对这些挑战,产业界正在探索混合架构的可能性。上海人工智能实验室推出的"书生2.0"大模型,创新性地融合了三种训练范式:用预训练构建知识基底,通过监督学习细化专业能力,最后以强化学习优化推理路径。这种"三阶段"架构在司法裁判辅助系统中表现突出,将类案推荐准确率提升至92%,同时将幻觉率控制在3%以下。
更前沿的探索来自对架构本身的革新。开幕式上,阶跃星辰首次公布了其"神经符号系统",该系统将深度学习与符号推理有机结合。在演示环节,该模型成功解决了传统大模型束手无策的复杂逻辑谜题,展现出接近人类的因果推理能力。"这可能是突破当前架构局限的关键方向。"张祥雨在技术发布会上表示。
值得关注的是,硬件创新也在推动架构变革。燧原科技发布的第二代AI训练芯片,专门优化了强化学习中的并行计算效率,使模型训练速度提升6倍。华为昇腾计算业务总裁在圆桌论坛中指出:"下一代AI芯片需要重新设计计算单元,以支持更复杂的推理架构。"
大会期间发布的《2025全球大模型技术白皮书》预测,未来两年将出现三大趋势:训练范式从单一走向融合,模型架构从统一走向领域专用,评估标准从静态指标转向动态适应能力。白皮书主编、中国人工智能学会理事长强调:"没有放之四海皆准的完美架构,关键在于找到特定场景下的最优平衡点。"
在闭幕演讲中,图灵奖得主Yoshua Bengio通过全息投影指出:"当前架构局限的本质,是我们尚未真正理解智能形成的机制。未来的突破可能来自神经科学、认知心理学与计算机科学的深度交叉。"这番论述为大会画上发人深省的句号,也预示着人工智能技术将迎来更深刻的变革。
黄浦江畔的这场思想碰撞清晰地表明:大模型的发展已进入关键转折期。当产业从追求参数规模转向注重实际效能,架构创新将成为决定胜负的关键。正如上海市经信委主任在总结发言中所说:"谁能率先突破泛化能力的瓶颈,谁就能掌握下一代人工智能发展的主动权。"这场关于"模型之问"的探讨,或许正在书写着AI技术演进的新篇章。
学科融合和科研范式变革?模式AI灵魂|经信研究·经济和信息化