位置:首页  >  详情页
【唐杰】深夜发文,AI从工具到劳动力只差这一步
来源:东北网 编辑:花皇颖儿 2026-05-21 09:49:55

从整体脉络来看,【唐杰】深夜发文,AI从工具到劳动力只差这一步并不是单一信息点,而是由多个细节共同组成。

随着黄仁勋踏上前往特朗普的空军一号,智谱股价暴涨 36.9%,收报 1150 港元,创下历史新高。

放到整体脉络里看,而就在暴涨之前不到 24 小时里,智谱创始人唐杰深夜在 X 上发布了一条推文,大谈了自己对整个 AI 产业的思考。

从细节来看,请注意,英文原文是 "Long-Horizon Tasks",直译过来应该是长视野但是在 AI 语境中,它是指一个任务需要跨越较长时间、较多步骤、较多中间状态才能完成。

进一步说,在唐杰看来,一旦模型能持续规划、试错、判断和交付,它冲击的就不只是程序员效率,而是整套人类执行层。

需要注意的是,长周期任务是什么?

需要注意的是,这本质上是在测试智力但长周期任务需要的不是智力,是执行力。

放到整体脉络里看,唐杰在推文中用黑客作为例子。

换个角度看,这个过程充满试错,因为没有标准答案,只能依赖经验和直觉。

换个角度看,如果 AI 能在这种对抗性、经验化的领域站稳脚跟,那么它对普通程序员、数据分析师、法务助理等职业的冲击只会来得更猛烈。

放到整体脉络里看,唐杰认为,衡量 AI 的方式,正在从看对话、答案,变成看 " 长周期 " 任务完成能力。

需要注意的是,另一个模型可能单次回答不够精彩,但能稳定地推进任务,记住每一步的结果,在遇到障碍时自动换路径。

进一步说,腾讯的姚顺雨曾提出一个概念,今天模型太依赖预训练里的 " 参数化知识 ",真实世界更需要能从当前 Context 里学习并应用的模型。

需要注意的是,一个能熟练调用这些工具的模型,比一个记住了所有 API 文档但不会实际操作的模型有用得多。

进一步说,但在长周期任务里,给定目标后,模型需要自主规划和执行。

需要注意的是,这需要模型具备某种 " 任务感 ",知道自己在做什么,为什么这样做,做到哪一步了。

换个角度看,企业和个人不再满足于 "AI 帮我写了一段代码 ",而是期待 "AI 帮我完成了整个功能模块的开发、测试和部署 "。

从细节来看,长周期任务的概念并不新鲜学术界早就在研究强化学习、任务规划、多步推理。

换个角度看,第一个就是记忆。

放到整体脉络里看,Claude Opus 4.7 支持 1M token 上下文窗口,GLM-5.1 支持 200K token这意味着模型可以在一个会话中记住数十万字的代码、文档、对话历史。

从细节来看,第二个是持续学习。

进一步说,模型不需要在训练时就学会所有知识,它只需要能快速吸收新工具、新 API、新业务规则当更新周期足够短,模型就能跟上现实世界的变化速度。

放到整体脉络里看,唐杰推测,Claude 可能已经实现了基础的自训练能力。

需要注意的是,它开始知道自己的答案是否靠谱,知道什么时候该重试、求证或回滚。

从细节来看,但这条路径也充满风险。

放到整体脉络里看,唐杰的判断是,这些能力通过精巧的工程 "tricks" 实现这意味着进展速度会比学术界预期的快得多,因为工程化的迭代周期远短于学术和技术上的创新周期。

进一步说,智谱的 GLM-5.1 在 SWE-Bench Pro 上达到 58.4%,超过 GPT-5.4 的 57.7% 和 Claude Opus 4.6 的 57.3%,就是这种工程化迭代的结果。

进一步说,作为智谱的创始人兼首席科学家,唐杰发这条 X 显然不只是技术观察,还多了一层战略宣言。

从细节来看,它不像 Kimi 那样靠 C 端爆款产品快速起量,也不像阿里、百度那样有庞大的生态和流量入口。

从细节来看,长周期任务这个方向,无论是国内还是国外,参与的玩家都很少,没有明确的领跑者,大家都在探索阶段。

从细节来看,然而二者在长周期这件事上,都还差点意思。

需要注意的是,虽然在纯模型能力上追赶 GPT 和 Claude 很难,不过在长周期任务这个新方向上,大家都站在同一条起跑线上。

需要注意的是,前者是增强,后者是替代。

放到整体脉络里看,真正被替代的是中间执行层,比如那些负责推进任务和协调资源的岗位在 NPC 里,人只需要设定目标和审核结果。

需要注意的是,智谱 GLM-5.1 的技术白皮书中提到,GLM-5.1 能持续独立作业 8 个小时,单次任务可稳定执行 1200-1700 步操作,无需人工监控与干预。

需要注意的是,长周期任务不是一个通用产品,它需要针对不同行业、不同场景做深度定制。

放到整体脉络里看,不是说把模型卖给企业就完了,智谱还要把模型打包成能直接上手的 agent 工具箱,客户不必从零开发,也能快速搭出自己的长周期任务系统。

进一步说,智谱的开源策略就是在构建这个生态。

放到整体脉络里看,还是会选择更保守的策略?就以唐杰提到的自我进化来说,智谱是会追求自我进化?

进一步说,一方面,GLM-5.1 的训练已经大量使用模型生成的合成数据,这是自我进化的雏形。

从细节来看,这种平衡很难,但可能是最现实的路径。

从细节来看,如果智谱能拿下长周期任务,那么它的业务会进一步增长,市值也会更高。

进一步说,基于对长周期任务的判断,唐杰给出了一个预言,未来我们可能会跨越 APP 的概念,直接进入 LLM OS 时代。

进一步说,然而我想说,这个判断触及了现代计算机的根本逻辑。

放到整体脉络里看,你要是想发邮件,你就打开邮件 APP,点击写邮件按钮,填写收件人、主题、正文,点击发送每一步都是预先设计好的,你只能在设计者规定的路径上操作。

需要注意的是,你告诉系统 " 给张三发一封邮件,告诉他项目进度 ",系统会自己决定用哪个邮件服务、怎么措辞、什么时候发送你不需要知道邮件 APP 在哪里,不需要知道怎么操作,你只需要表达意图,系统负责执行。

从 1 月 8 日上市时的 116.20 港元发行价算起,智谱的股价在短短四个多月内增长了 900%。

换个角度看,整条推文的核心是 " 长周期任务 "。

换个角度看,他认为,2026 年最可能的突破点不在于模型变得更聪明,而在于模型能够持续完成复杂、多步骤的任务。

需要注意的是,以前 AI 替人写几句话,大家还能说它只是工具一旦 AI 能连续几天自己干活、自己判断、自己交付结果,它要替代的就不只是某个岗位了,它可能会彻底替代某一个行业。

进一步说,过去两年,我们评价一个大模型的好坏,主要看它在单次对话中的表现回答是否准确、逻辑是否清晰、语言是否流畅。

需要注意的是,目标明确但路径不确定,需要持续数个小时、数天甚至数周的长期推进。

需要注意的是,他说,漏洞挖掘是典型的长周期任务需要阅读大量代码、理解系统架构、搭建测试环境、构造攻击输入、验证漏洞有效性,最后撰写技术报告。

换个角度看,你不能只读一遍代码就找到漏洞,你要反复去尝试不同的攻击向量,在每次失败后调整思路,在每次成功后验证可靠性。

进一步说,因为这些职业的任务虽然也很复杂,但对抗性更弱,经验依赖度更低,更容易被系统化的流程覆盖。

从细节来看,一个模型可能在单次对话中表现完美,但在需要持续工作 8 小时的任务中频繁出错、丢失上下文、重复无效操作。

放到整体脉络里看,那么后者在长周期任务中的价值,就高于前者。

需要注意的是,当模型真正开始跑任务的时候,它需要查文档、跑代码、测接口、读日志、调参数。

此外,以前的模型过于被动,它得等待人类发出指令后才能执行,而且每发出一次指令,只能执行一步。

进一步说,被动响应只需要理解当前问题,主动推进需要理解整个任务的结构、当前所处的阶段、下一步应该做什么、如果失败了该如何调整。

进一步说,当有了这一切后,AI 就开始进入 " 结果交付 " 阶段。

需要注意的是,这是从助手到承包商的跨越助手需要你告诉它每一步做什么,承包商只需要你告诉它最终要什么结果。

进一步说,唐杰认为,正是因为如下几个关键技术突破,长周期任务在今年变得可以实现。

放到整体脉络里看,百万级上下文窗口和 RAG 技术的成熟,让模型能够在长时间任务中保持对项目背景、历史尝试和用户偏好的记忆。

放到整体脉络里看,它不会因为任务太长而忘记最初的目标,不会重复已经尝试过的失败方案,不会丢失中间步骤的关键信息。

进一步说,虽然真正的持续学习仍然困难,但模型更新周期正在急剧缩短全球领先模型已经做到月度更新,国内模型紧随其后如果明年能做到周更新,事实上就接近了持续学习的效果。

换个角度看,第三个是自我判断、自我进化。

进一步说,模型自己写代码、清洗数据、生成合成数据,然后用这些数据训练自己GPT-5.5 就在用模型生成的代码和测试用例来改进自己的编程能力。

换个角度看,这种能力在长周期任务中至关重要因为没有人会在旁边监督每一步,模型必须自己判断当前方案是否可行,是否需要调整,是否已经达到目标。

换个角度看,我们对于 AI 的价值又是什么?自我进化意味着人类对模型训练过程的控制力在下降当模型开始自己生成训练数据、自己评估训练效果时,我们如何确保它不会偏离人类的价值观?

从细节来看,你只需要在现有架构上做更好的 prompt 工程、更精细的强化学习、更可靠的工具集成。

放到整体脉络里看,智谱:在长周期任务赛道上的战略押注。

从细节来看,智谱在国内大模型阵营中的特点是技术底子扎实,但商业化节奏相对谨慎。

换个角度看,智谱的路线一直是 " 模型能力先行,应用场景跟进 "先把基座模型做到足够强,再通过 API、私有化部署、行业解决方案变现。

换个角度看,OpenAI 的 GPT-5.5,定位就是 " 自主任务执行 ",强调的是 agent 能力和多步骤工作流,Opus 4.7 也是类似。

需要注意的是,两家公司并没有展现出压倒性优势,市场格局也还远未定型。

换个角度看,唐杰进一步提到了 NPC 这个概念他认为长周期能力会推进从 OPC 到 NPC 的转变一人公司的逻辑是 " 人加 AI 工具 ",无人公司的逻辑则是 "AI 系统加人类监督 "。

换个角度看,不过无人公司并不是真的没有人,而是人的定位发生了改变,从执行者变成了目标设定者、资源配置者和责任承担者。

进一步说,落到智谱身上,唐杰的观点预示着智谱接下来的发展方向。

放到整体脉络里看,不过这只是一张成绩单,要真正让企业放心,还得看它换到更多场景后会不会掉链子,遇到没见过的问题时能不能靠自己的手段解决。

进一步说,软件开发需要的是代码理解和测试执行,法律行业需要的是文档检索和合规检查,金融行业需要的是数据分析和风险评估。

换个角度看,长周期任务系统不是智谱一家能做出来的,它需要开发者贡献工具和插件,需要企业客户提供真实场景和反馈,还需要监管机构制定安全和合规标准。

从市值来看,智谱是国产 AI 的中流砥柱,唐杰的每一个判断都会对国内 AI 产生很大的影响。

从 GLM-5.1 来看,智谱在走一条中间路线。

进一步说,可另一方面,智谱强调 " 可解释的、可监管的 " 系统,这意味着它不会完全放弃人类控制。

放到整体脉络里看,长周期任务是企业的核心痛点,它能直接替代人力成本,能直接提高业务效率,企业愿意为此支付更高的价格。

放到整体脉络里看,AI 吞噬世界。

从细节来看,应用按需生成,用户不再管理文件、窗口和按钮,用户只管理任务、权限和结果什么是 LLM OS?

放到整体脉络里看,APP 的本质是把功能固化在界面里,用户通过点击按钮来触发预设的功能。

进一步说,agent 的本质则是把目标交给系统,让系统临时组合工具、数据和界面来达成目标。

换个角度看,如果唐杰说的这个趋势成立,软件的中心将从 " 打开哪个 APP" 变成 " 告诉系统我要什么结果 "这将会颠覆现有的一切。

把前面的信息放在一起看,【唐杰】深夜发文,AI从工具到劳动力只差这一步更值得继续关注的,仍然是后续变化与实际影响。

bayi的定义与背景

在当今的网络环境中,bayi已成为一个普遍讨论的话题。这种现象涉及多方面的因素和考量,需要我们从多个角度进行分析和理解。bayi的出现源于市场的真实需求,反映了用户对高质量服务的持续追求。近年来,随着互联网技术的快速发展,bayi相关的产品和服务层出不穷,不仅改变了人们的生活方式,还推动了整个行业的转型升级。通过深入分析,我们可以发现其中蕴含的商业逻辑和发展趋势。

bayi的核心价值在于解决用户的实际问题。许多人在日常生活中面临各种挑战,而bayi提供了一种高效便捷的解决方案。具体来说,它能够帮助用户节省时间、降低成本、提升体验,这正是bayi受到广泛欢迎的根本原因。

bayi的潜在价值

bayi能够为用户带来多方面的收益。首先,它可以显著提升工作效率,帮助用户在更短的时间内完成更多的任务。其次,bayi还能够帮助用户获取更多的信息和资源,拓宽视野,增强竞争力。

从行业发展的角度来看,bayi代表了未来的趋势和方向。它能够推动技术创新、促进产业升级、创造新的就业机会。越来越多的企业和个人开始关注bayi领域,投入大量资源进行研发和推广。

此外,bayi还具有重要的社会意义。它能够促进信息的公平获取,缩小数字鸿沟,让更多人享受到科技发展带来的红利。

如何正确利用bayi

正确利用bayi需要掌握一定的方法和技巧。首先,用户应该选择正规可靠的平台和服务商,确保获得高质量的产品和服务。其次,要注意保护个人信息安全,避免在不可信的环境中暴露敏感数据。

在实际应用中,建议用户根据自己的具体需求进行选择,不要盲目跟风。同时,要持续学习和更新知识,跟上bayi领域的最新发展动态。

总之,bayi是一个充满机遇和挑战的领域。通过正确的方法和持续的努力,每个人都能从中获得实实在在的价值和收益。

   bayi,改进“线索未触发”时的系统提示,网络空间迷局,真相永远被谎言掩盖 - 【哔哩哔哩】_【bilibili】  【唐杰】深夜发文,AI从工具到劳动力只差这一步 拿捏{育儿}(焦虑)年入30亿,泰兰尼【斯却】栽在“送礼广告”? 停飞一年后,这【家航】(司走)向破产重整{前的}预重整 中国大陆雅思考试将于9月1日起停止纸笔考试,全部【采用】机考 开拓者媒体《人指》【出杨】瀚森三大短板![今夏]必须减重攻防两端严重偏科 [当头]【一棒】!比赛即将开打,上海申花先遭重创,取胜武汉三镇有点悬
台海观澜 | 台湾政治精英《的三》种脸(色一)种心态

http://ea.ouozr.cn/vshow/166360

「活动」首次登录送73积分

742.83MB
版本V6.0.46
下载bayi安装你想要的应用 更方便 更快捷 发现更多
喜欢 66%好评(8997人)
评论 303
【唐杰】深夜发文,AI从工具到劳动力只差这一步截图0 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图1 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图2 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图3 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图4
详细信息
应用介绍
一.暖暖在线观看免费直播  【唐杰】深夜发文,AI从工具到劳动力只差这一步 工口漫画h
二.色在线视频免费观看视频  联合《国机》构:加(沙爆)炸物污染严重 已成“每日紧急危机”
三.龚玥菲演的《金梅》免费观看  推动中美两国【民间】交往走[深走]实
四.毛网地址  女子称丈夫买榴莲时将1万错付成11万,【联系】商家退款却被告之已[退还],当事人回应
五.视频游戏吧  瞒了近三个月,内塔尼亚胡终于说{出实}情:没料到伊朗敢【做到】这《一步》
六.手机成人短片下载  中美{元首}会晤,世《界吃》下一颗“定心丸”
七.大学生初尝滋味  伊朗外长说美方认真才可能重[启谈]判,霍尔木兹仍对伊(朗友)《好国》家商船开放
八.404黄台软件免费下载安装  为190元榴莲“仅退款”千里{讨公}道,【商家】“程大叔”公布行政处罚结果:女子伪造变霉图片被行拘7日;对于是否提起诉讼,要看对方的认错态度
九.樱狼h  [曾被]处分的“85后”(拟提)拔进【常委】,公示期满却没了下文
十.香港姓李的女星  清华博士妈妈时隔200多天见到两岁幼子,孩子《父亲》称[需孤]身见面、签协议、撤禁令;此前男方曾带多人当街抢娃,被【拘留】15天

【联系我们】
客服热线:400-7686-4130
加载更多
版本更新
V8.4.88
马[克龙]“《翻车》”,法国“诚意”遭质疑

天体海滩类似软件

猜你喜欢

包含 传说中的视频 的应用集
评论
  • 【光明漫评】以博(物馆)为桥,联结多元【世界】 2026-04-16
    草留色区
  • 3-0!维{拉首}(夺欧)联杯+终结30年冠军荒,54岁埃梅里5《次夺》冠创纪录 2025-11-05
    成人wang
  • 伊朗方面表《示已》制定管理霍尔木兹海峡指定航道{的专}业机制 2026-02-11
    日本一曲二曲三曲高清青柠
  • 中方:霍尔木兹《受阻》根源{在美}以 2026-01-27
    视讯美女
  • 突发![伊朗]最大岛屿传出巨响!以总理(计划)【再访】美劝特朗普重启战争,以媒:特朗普近日差点下令再次空袭,但最后一刻改了主意 2026-02-04
    露b装
  • 196周戛《然而》止!WTA最新排名公布:中国{金花}郑钦文跌出前50 2025-12-31
    农民伯伯2免费完整版电影
  • 5名意大利人在马尔代夫潜水时身亡,1人遗体{在水}下60米深的洞穴【中被】找到 2026-02-03
    男色无限
  • 中方{特别}点名:【高度】《警惕》日本 2025-11-12
    品色 地址
  • 百亿{级并}购尘埃落定腾《讯音》乐正式“收编”喜马拉雅 2026-02-22
    《轮流上阵》电影
  • 资治通鉴:怎么给领导{当白}手套?3点职场生存智慧,让你飞黄腾达! 2026-03-07
    我要射了