在2023年3月31日,全球科技界的目光聚焦于“2025中关村论坛年会”,在智谱OpenDay的演讲中,中国科学院院士张钹以其深邃的见解引发了对人工智能未来发展的热烈讨论。他指出,当前社会正处在历史性的变革时代,而这一转变的关键因素正是大模型的崛起和普及。张钹院士的言论不仅揭示了人工智能技术范式的根本性变化,还勾勒出机器如何像人类一样具备思考能力、执行能力和感知能力的前景。
张钹首先对大模型的重要性进行了分析,强调这种技术是通过庞大的人工神经网络和数据学习,赋予了机器以前所未有的思维能力。这一技术的飞跃,主要得益于生成式预训练变换器(GPT)的持续发展。正如哲学家维特根斯坦所说,“语言界限就是我的世界界限”,当机器理解并掌握人类语言时,它将开启一条充满无限可能性的道路。
在对当前大模型发展的探讨中,张钹特别提到了“规模定律”,即神经网络的规模和数据量在推动模型能力提升中的核心作用。然而,他指出,若要打破这一限制,必须提升大模型的性能并有效降低成本。这带来了一个关键问题:如何提升大模型的性价比?张钹院士为此提出了几条重要的探索方向,包括思维链(CoT)、深度思考(Deliberate Thinking)和AI反馈强化学习(RLHF),旨在使大模型的自主思考和推理能力得到显著增强。
张钹还强调,人工智能正在逐步迈向“智能体化”的时代,智能体必须具备以下三种能力:思考能力、执行能力和感知能力。他揭示了当前大模型在数字世界中的应用相对成熟,但若要成功迁移到物理世界,其中执行能力和感知能力的提升则是面对的重大挑战。同时,大模型在推理能力上亦存在三大难题,值得深入探讨。
首先是多层次空间的架构问题。张钹提到,现有的语言模型构建空间主要使用token,虽然具备良好的数学特性,但缺乏必要的层次性,这对于复杂推理显得不够充分。相较之下,图像领域通过扩散模型成功解决了此问题,语言模型同样需要在这一方向上进行更多探索。张钹认为,一旦扩散模型能够有效运用到语言推理中,必将极大提升推理的准确性。
其次是推理过程与结果之间的偏差。当前许多推理模型重视结果的优化,而忽视了推理的过程。张钹指出,科学推理的核心在于过程,而不仅仅是结果。因此,有必要进一步强化AI推理过程的优化,使其更符合人类的逻辑。这需要增强强化学习领域的研究投入,才能真正打破这一瓶颈。
最后,张钹还强调了AI可解释性的重要性。他指出,这一问题并非仅靠企业的努力就能解决,更需要学术界与产业界的通力合作,寻找理论层面的创新突破。
总之,在张钹院士的演讲中我们看到了人工智能领域的未来潜力与挑战,尤其是在个人智能体的构建上,包含了思考、执行、感知三大核心能力的发展历程不可忽视。未来,人工智能如何与物理世界接轨,提升自身的感知与执行能力,将直接决定其在社会各领域的应用状况与深远影响。这不仅是技术进步的体现,更是社会变革的重要推手。返回搜狐,查看更多