新京报AI研究院/行业观察继OpenClaw“蝗虫”之后,最近AI行业又一个新词火了:Harness Engineering。在硅谷,它迅速席卷了人工智能工程领域。在中国,它出现在林俊阳的长篇文章和唐道生的演讲中。什么是线束工程?简而言之,它是一种较少关注模型性能而更多关注工程环境的范式。通过将“控制模型的系统环境”专业化,我们提高了其使用的有效性。事实上,国内主要厂商已经将这一理念融入到了自己的产品设计中。过去一周,京报人工智能研究院听取了腾讯、百度、百度三大厂商的官员讲述了他们对线束工程的理解。我们发现“除了模型之外还观察环境”和“联合更新模型”“框架”正在成为AI行业发展的关键变革之一。什么是线束工程?在AI大规模语言模型推进的初期,开发者提到最多的概念就是快工程:如何清晰地说话、提供实例、为大规模模型设计格式。事实上,很多AI应用在产品层面都融入了快词项目。新京报AI研究院发现,在Button、钉钉等很多应用中输入快词时,存在一个“快词优化” 2026 年初,harness Engineering 取代了 Quick Word Engineering,成为硅谷最流行的 AI 工程范式,本质上,它是为 AI 代理(agent)构建一套完整的环境、约束规则和反馈循环,让他们能够可靠、自主地完成复杂的任务。定义不明确。 “AI。每次犯错,就设计一个解决方案,避免再犯同样的错误。”目前业界有一个共识,没有一个模型可以支持所有代理场景。 “通用模型的泛化能力在复杂的现实环境中受到限制,而线束工程是填补这一空白的重要途径。”百度云相关业务负责人周云(化名)告诉新京报人工智能研究院。他告诉记者,线束工程化的核心价值不仅在于创造新的能力,还在于通过工程化手段激发和稳定通用车型的现有能力,使其在特定场景中规模化。 “这个大型模型让您可以想象一匹在户外表现出令人难以置信的体力的马。一匹猖獗的野马。它速度很快,但在野外的表现却难以预测。”在云洲看来,马具工程是一件精密的“马器”。对于拉rger 模型中,缰绳是 Prompt Engineering,鞍座是 RAG(检索增强生成)附加组件,马镫是闭环沙箱运行环境。如果没有这套“马具”,骑手(在商业环境中)就无法指挥野马完成精确的栅栏或长距离比赛。有了挽具,您可以将野马变成稳定的赛马。正如人类智力的进步来自于工具使用的进化一样,人工智能的进化也将学会使用世界上的工具。那么,普通用户如何理解这一技术范式呢?周云告诉新京报人工智能研究院,普通用户不需要了解这背后的算法,但线束工程的存在可以有效抑制大规模模型的“幻觉”现象,保证AI的实现。识别事实而不是严肃的废话,让人工智能提供个性化的帮助而不是通用的对话,防止人工智能产生有害信息,并为人工智能建立“隔离沙箱”,确保所有操作都在安全范围内进行,保护您的数据隐私。 ”新京报人工智能研究院发现,线束工程化的概念其实已经深深扎根于国内各大厂商的产品中。腾讯集团高级执行副总裁唐道生、付和是第一个公开提及这个概念的人。3月27日,他在腾讯云上海峰会上发言时表示:“人工智能实现不仅是算法问题,更是工程问题。即使模型功能相同,不同的线束设计也会影响AI落地的实际效果。”他在4月火山引擎武汉峰会后接受采访时表示,腾讯需要“全面强化模型线束和工具,精心工程实现,最大限度发挥大模型的功能,让应用更加高效”。2日,火山发动机总裁唐岱也向记者谈到了线束工程的话题。他说,火山引擎发布的 Arcclaw 是“被咬的龙虾版本”,已经使用了这些类型的架构特征。 “中心思想是提供服务,产生最好的框架,而框架必须随着模型的发展而发展。例如,能够在OpenClaw上更好地运行豆袋模型,也将有助于行业更好的发展。”人工智能研究院表示,线束工程本质上是软件工程和人工智能之间的深度交叉,该研究所也表达了对线束的看法。内置的安全沙箱允许人工智能在隔离的闭环环境中执行代码和文件,而不会分散风险。 “高危拦截”机制确保删除文件等敏感操作经过两次人工确认。这给AI踩了“刹车”。你将成为一个可以克服聊天机器人局限性的“AI伙伴”并自主完成应用程序和文件之间的任务。这种从“懂”到“做”的闭环是通过Harness项目实现的,它精确指导了Word、Excel、PPT等现实办公场景中大型模型的功能。北京报业人工智能研究院指出,这种新范式具有直接指导企业IT领导者的重要性,这意味着不必将所有精力都花在“选择哪种模式”上。随着传统模型推理能力的差距逐渐缩小,围绕模型构建的工程系统将真正决定实施的有效性。 3月26日,原同易前文技术总监林俊阳也在长文中提到了该线束。 “强化学习代理将策略构建到更大的工具中,包括工具服务器、浏览器、端点、搜索引擎、模拟器、执行沙箱、API 层、内存系统和编排框架。同时,这也意味着线束工程的崛起。”他进一步指出,智能代理时代的竞争优势将来自于更好的环境、训练与推进更紧密的耦合、更稳健的线束工程以及将模型决策与决策结果闭环链接的能力。在唐道生看来,随着行业的发展,各大大型模型的复杂推理能力都非常强大,国内开源模型与海外闭源能力之间的差距正在逐步缩小,劣质服务正在逐步缩小。向市场提供更具成本效益的大规模模型。事实上,客户根据自己的业务场景以及性能和成本偏好有很多选择,因此,线束的工程设计将受到进一步的考验。“训练代理模型的最大失败点是重建真实环境。nt,不是型号。 2026年,我们不需要通用的一刀切模式。我们需要在垂直场景中利用工程。通过学习,我们的目标是建立一个高效、高性能的强化学习系统。 “谁能把这根‘马具’做得最轻、最强,谁就能率先引领产业级智能体。”周云对新京报人工智能研究院表示。追踪人工智能全球前沿,洞察行业实时变化。我们以独立、专业的视角观察技术演进、产业实践和生产。动态逻辑以全景的方式记录人工智能行业的所有重大变化和发展过程,持续记录智能时代的浪潮和演进。新京报人工智能研究院编辑罗一丹纠错:杨芳芳刘俊