在2026年6月24日的英伟达年度股东大会上,创始人兼CEO黄仁勋发表了一个历史性的宣告——智能体(Agent)时代正式到来。他明确表示,本轮计算范式转变是60年来最大规模的行业重置,其影响将超过从大型机到个人电脑、从桌面到移动互联网的所有前几次变革。黄仁勋透露,英伟达正在开发针对智能体场景深度优化的下一代计算架构,将CPU、GPU和NPU的功能融为一体。
黄仁勋指出,传统的计算架构是为"执行指令"而非"自主决策"而设计的。传统CPU以指令执行为核心设计目标,每次执行一条指令,程序流程由开发者在编译阶段预先确定。而智能体AI所需要的是完全不同类型的计算能力——能够同时处理多路推理请求、具备上下文记忆能力和自主决策能力的全新架构。
具体来说,Agent需要在同一时间处理多个不同的任务流:既要理解用户的自然语言输入,又要根据上下文生成响应,还需要实时调用外部工具或API获取信息。这种"多路并发推理"的需求远远超出了传统CPU的设计范畴。黄仁勋表示:"今天的AI Agent就像一个需要同时下20盘棋的棋手——传统的顺序计算架构根本跟不上它的节奏。我们需要彻底重新思考计算架构的基础设计。"
英伟达正在开发的新一代计算架构,核心设计理念是"Agent-First"(智能体优先)。与传统架构"应用先行,硬件适配"的模式不同,Agent-First架构从底层开始就为智能体的工作负载特征进行优化。该架构将CPU的灵活调度能力、GPU的高吞吐并行计算能力和NPU的低功耗推理能力融合在一个统一的芯片上。
据英伟达架构师透露,新架构在三个维度上进行了突破性设计:第一是采用了"异构计算池"方案,不同计算单元可以动态组合来执行一个Agent任务,任务完成后资源自动释放并重新分配;第二是引入了"上下文缓存总线",Agent的状态信息和对话历史可以在不同计算单元之间高效共享,避免了传统架构中频繁的数据搬运开销;第三是设计了"Agent指令集扩展",将常见的Agent操作(如工具调用、函数执行、向量检索)直接硬件化,从而将执行效率提升1到2个数量级。
黄仁勋还深刻分析了智能体在落地过程中面临的关键挑战。他指出,当前大多数企业的AI Agent部署仍然停留在"玩具阶段"——单任务、低负载、无监护。而真正企业级的Agent部署需要解决四大核心问题:可靠性与一致性、可审计性与合规性、安全性与可控性、成本与效益的平衡。
特别值得关注的是,黄仁勋强调"智能体幻觉"是一个比"大模型幻觉"更具挑战性的问题。当Agent自主做出决策、执行操作时,一次错误的判断可能导致连锁反应。为此,英伟达正在与多家企业合作开发"Agent行为验证"框架,在Agent执行每个关键操作前自动进行风险评估。该框架的核心是在Agent系统内部署一个"监督Agent",专门监控主Agent的决策是否在预设的安全边界内,一旦发现异常立即干预。
黄仁勋在演讲中引用了多份行业报告的数据来论证Agent经济的巨大潜力。据Gartner预测,到2028年超过60%的企业IT应用将集成AI Agent能力;据IDC数据,全球智能体AI市场规模将在2027年突破3000亿美元,年复合增长率超过80%。
他特别指出,Agent经济与传统SaaS经济最大的区别在于价值创造方式。SaaS模式中,软件提供商通过许可证收取费用;而在Agent模式中,AI代理直接参与业务流程,帮助企业完成实际工作。这意味着Agent的定价模式也将发生根本性转变——从"按座位收费"变为"按价值收费"或"按成果收费"。这一转变将重塑整个企业软件行业的商业模式,堪称软件行业60年来最根本的变革。
从技术演进的规律来看,任何一个新兴产业在走向成熟的过程中都会经历"技术突破—商业验证—规模化推广—生态建立"的四个阶段。当前这个行业正处于从"商业验证"到"规模化推广"的关键过渡期。技术能力已经基本满足了商业化部署的条件,但商业模式和应用场景仍在探索之中。在这一阶段,那些能够率先找到产品-市场契合点(Product-Market Fit)的企业将获得显著的先发优势,而落后者则可能面临市场份额被蚕食的风险。因此当前最重要的不是追求技术的极致完美,而是快速迭代、快速试错、快速调整。
对于普通用户和企业决策者来说,理解这一领域的核心价值至关重要。AI技术的价值不在于技术本身有多先进,而在于它能否解决实际问题、创造实际价值。这些最新进展不只是技术圈的自嗨,而是正在切实改变我们工作和生活方式的底层驱动力。从降低创作门槛到提升生产效率,从个性化服务到智能化决策,AI技术正以前所未有的速度和广度渗透到每一个产业环节。企业需要的是从自身业务需求出发,找到最适合的AI应用场景,而不是盲目追逐最新技术。