梁文锋“隆中对”深度解析:战略蓝图与未来展望
时间:2026-05-27 13:26:37
小编:china
阅读:
声明:本文源自微信公众号字母榜,作者:李炤锋,授权站长之家转载发布。
这几天,DeepSeek700亿元融资的热度还没散去,另一条线索已经浮出水面:它正把重心压向AI Coding。
近日,DeepSeek方面连续发布了两个新岗位:Agent Harness产品经理和Agent Harness研发工程师。
按照招聘信息的说法,DeepSeek正在把前沿模型能力转化为Agent产品,模型之外的工作,都被归入Harness范畴。入职者将加入Harness团队,参与DeepSeek桌面端Agent产品的研发全过程。
这几句话,基本划出了DeepSeek新业务的边界。
DeepSeek资深研究员陈德里在社交平台招人时,标题直接写到“来DeepSeek从零做Code Harness”,并提到“对标Claude Code,做DeepSeek Code Harness”。
据报道显示,字节Seed团队过去一年被挖走近70人,其中就包括Seed Edge长期研究计划成员徐名宇,目前,他已加入DeepSeek模型结构组,从事模型结构相关研发。
在字节时期,徐名宇曾是论文DeltaFormer的第一作者,论文讨论标准Transformer在状态跟踪任务上的表达限制,正文点名Python代码执行、实体跟踪、棋类等任务,并尝试用DeltaNet增强Transformer处理状态空间问题的能力。
徐名宇的加入,补的是DeepSeek Code背后的模型结构能力。崔添翼对应产品和系统工程,徐名宇对应更底层的连续任务能力,两条线共同指向DeepSeek正在做的Code Agent。
Code Agent进入真实仓库后,最容易暴露的问题也常常不是写不出一个函数,而是十几轮修改后忘记最初目标,跨文件改动后逻辑不一致,测试失败后不能沿着旧状态继续修,这些考验的都是模型在连续步骤中保存和更新状态的能力。
另一边,DeepSeek的Harness招聘,已经把对标对象写得明明白白。官方披露的招聘信息称,Agent Harness岗位要求候选人深度使用Claude Code、Cowork、Codex、Cursor、OpenCode、GitHub Copilot、Manus、OpenClaw、Hermes等产品。
显然,DeepSeek Code的成长路上需要两类经验:一类来自真实系统,处理模型输出后的执行后果;一类来自模型结构,处理多轮任务里的状态保持。持续的人才补强,也揭开了这一轮AI人才攻防战的新一回合。
B
几周前,DeepSeek核心人物郭达雅转投字节,被外界视为DeepSeek的一次重要损失。
他的履历与DeepSeek基座模型的几块基石有着紧密联系。公开报道显示,郭达雅专注代码智能和大语言模型推理,参与过DeepSeek-Coder、DeepSeekMath、DeepSeek-Prover、V3、R1等项目。而在DeepSeek-Coder论文里,他排在第一作者位置。
今年3月前后,郭达雅被曝从DeepSeek离职,随后加入字节Seed。一些公开报道显示,他看好Agent方向,而DeepSeek内部当时Agent优先级并不高;加入字节后,Seed内部正启动围绕Agent和Coding的组织整合。
回到几周后的今天,手握数百亿融资的DeepSeek,一边开始奋起直追补课Harness Agent,一边开始试图引入更多“郭达雅”充实人才库。
当然,这场人才攻防战在郭达雅离职前就早已打响,而DeepSeek从未停止过在Coding等模型垂直方向的人才引入。
近期披露的2026字节跳动奖学金名单中,就有一个值得关注的名字。
据字节方面披露,字节跳动奖学金至今支持了67位青年研究者;2023年得主路橙、朱琪豪分别是OpenAI Sora2和DeepSeek GRPO的重要研究贡献者。
其中,朱琪豪是北京大学计算机学院2024届博士毕业生,专注深度代码学习。他在DeepSeek团队中基于博士论文工作,主导开发了DeepSeek-Coder-V1;此后又出现在DeepSeek-Coder-V2和DeepSeekMath/GRPO相关论文中,是DeepSeek代码模型和强化学习路线里的早期参与者。
值得关注的是,在DeepSeek-Coder的迭代历程中,朱琪豪的位置有一个清晰变化。
DeepSeek-Coder V1的作者列表里,郭达雅排在朱琪豪之前;到了DeepSeek-Coder V2,朱琪豪的名字已在郭达雅之前。
作者顺序当然不能直接等同于内部贡献大小,但对一条连续迭代的技术线来说,毫无疑问传递出的信号是,朱琪豪是DeepSeek系列模型Coding能力的绝对核心人物。
另一条不能忽略的是多模态。
在Chatbot形态里,DeepSeek的多模态短板还不明显。用户主要用文字提问,模型只要在推理、写作、代码和长上下文上表现足够强,就能支撑大部分使用场景。DeepSeek过去一年最强的公众认知,也确实来自R1、V3、V4,以及低成本API。
但桌面端Agent会改变这个前提。代码Agent如果进入开发者电脑,就不只是在聊天框里回答问题,还要理解IDE界面、终端报错、浏览器文档和截图反馈。换句话说,读屏能力会从“加分项”变成基础能力。
潘梓正,是DeepSeek多模态业务中被公开披露较多的名字。
去年2月,多家媒体转述了英伟达高级研究科学家禹之鼎的社媒内容。禹之鼎回忆,潘梓正2023年夏天曾在NVIDIA实习,当时NVIDIA考虑给他全职机会,但潘梓正“毫不犹豫”选择回国加入DeepSeek;那时DeepSeek多模态团队只有几个人。
禹之鼎还提到,潘梓正在DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1等多个项目中发挥了“关键作用”。他写道,潘梓正的案例是近年来他看到的典型例子:很多最优秀的人才来自中国,这些人才不一定只能在美国公司取得成功,美国研究者也能从他们身上学到很多。
DeepSeek-VL2的能力方向,和Code Harness并不远。VL2覆盖视觉问答、OCR、文档、表格、图表理解和视觉定位;这些能力放到桌面端Agent里,正好对应读屏、读报错、读网页文档和理解界面元素。
但DeepSeek多模态近期缺少一个真正站到台前的突破。Janus-Pro在2025年1月发布,DeepSeek称其图像生成能力超过DALL-E3和Stable Diffusion;VL2则停留在2024年12月的视觉语言模型更新。
这意味着,DeepSeek已有读屏和视觉理解的技术底子,但还没把多模态打成和R1推理、V4长上下文一样清晰的品牌标签。如果DeepSeek Code真要做桌面端Agent,多模态大概率仍是后续补人的方向。
回到陈德里在去年乌镇世界互联网大会上的讲话,他在谈AI稳定性时说,模型训练完后参数固定,不能像人一样在真实世界中自我迭代。他提到的方向,是让AI具备稳定学习算法,并通过多模态等方式与真实世界建立更多链接。
面对着大模型发展行业的卡点,DeepSeek内部有着清晰的认知。但回过头看过去一年的更新缓慢和人才流失,显然大模型竞争是一个考验资本厚度和耐力的长期作战,需要更多“弹药”供给,700亿融资到位后,不只是Code Harness,也许DeepSeek也将进入多线叙事的快速铺开产品的逻辑。
C
只看基座模型,DeepSeek已经站进第一梯队,但也并非领跑位置。
新一代DeepSeek-V4-Pro在代码基准和Agentic任务上缩小了与领先闭源模型的差距。DeepSeek V4-Pro在SWE-bench Verified上达到80.6%,接近Claude Opus4.6。
此外,DeepSeek V4在Vibe Code Bench中成为开源权重模型第一,得分49.9%,也是唯一超过40%的开源权重模型。
但是,强模型和强产品,本质上还是两件事。Claude Code的商业化数据,是DeepSeek无法绕开的参照。
Anthropic披露Claude Code年化收入超过25亿美元后,外界对AICoding的估值逻辑已经变了。它不再只是模型公司展示能力的Demo,而是可以直接贡献收入的产品线。
Claude Code的形态也已经超出聊天框。
它能在开发者代码库中工作,通过终端、IDE、桌面端、Slack和网页使用;在本地终端运行时,会在改文件或运行命令前请求授权。这个设计让AICoding进化成了项目级的助手。
和Claude Code齐头并进的,还有OpenAI的Codex、Google Antigravity2.0,大厂正在把AICoding从编辑器插件推向独立开发环境。
与此同时,这也是国产模型竞争最激烈的领域之一。
Kimi和智谱近期在Coding领域的跑分,先后进入了第一梯队。SWE-Bench Pro成绩显示,Kimi K2.6为58.6%,GLM-5.1为58.4%,DeepSeek V4Pro-Max为55.4%。
SWE-Bench Pro测的是工程修复能力。它选取真实GitHub项目中的Issue和测试用例,让模型提交补丁,再看测试是否通过。在这组更难的任务里,Kimi和GLM都跑在DeepSeek前面。
DeepSeek也不是没有强项。有评测显示,V4Pro在SWE-Bench Verified上达到80.6%。Verified版经过人工筛选,常用来观察模型处理真实代码问题的稳定性。
具体打法上,智谱通过GLM Coding Plan进入Claude Code、Cline、OpenCode等已有开发者工具,Kimi也有kimi-cli、Kimi Code等终端和代码工具入口,同时还通过Cursor Composer等第三方产品进入开发者工作流。
而随着DeepSeek Code Harness浮出水面,DeepSeek将与这两位国产同行一同竞争AICoding的用户心智。
尤其是当这一轮融资被推到700亿元时,DeepSeek正好站在Code Harness这个岔口。
此前,DeepSeek管理层向潜在投资者表示,融资落地后,会优先推进突破性AI研究,而不是短期商业化。
对DeepSeek来说,融资首先意味着算力池可以继续做大。DeepSeek官网介绍中提到,其依托自研训练框架、自建智算集群和万卡算力资源;GitHub上,DeepSeek还开源了面向AI训练和推理负载的3FS分布式文件系统。
3FS可以理解成DeepSeek给大模型集群配的一套高速共享硬盘系统。训练和推理时,GPU需要持续读取数据、保存模型状态,3FS负责把分散在多台机器上的SSD整合起来,通过RDMA网络高速传输数据。
DeepSeek称,这套系统在180节点集群里跑到过6.6TiB/s的聚合读取吞吐。
而更大的背景,是国产算力替代正在被V4推到前台。最新发布的DeepSeek V4已适配华为昇腾AI芯片,华为昇腾950超节点将完整支持V4。有行业分析指出,DeepSeek曾与华为、寒武纪合作改写部分模型代码,以适配国产硬件。
因此,DeepSeek Code Agent不只是一个Agent产品,它很有可能是DeepSeek把模型能力、国产算力和用户场景连起来的前沿入口:一端承接V4在国产硬件上的落地,一端进入开发者的生产流程。
2025年初,DeepSeek靠R1证明,一家中国模型公司可以突然改写全球大模型叙事。
现在轮到Code Harness回答另一个问题:全球最成功的大模型公司之一,能不能在Agent领域再现一次DeepSeek神话。
- 梁文锋“隆中对”深度解析:战略蓝图与未来展望声明:本文源自微信公众号字母榜,作者:李炤锋,授权站长之家转载发布。这几天,DeepSeek700亿元融资的热度还没散去,另一条线索已经浮出时间:2026-05-27
- 咸宁金桂湖华彬万达美华度假酒店开业:桂香竹韵间启幕湖畔度假新体验近日,位于湖北咸宁的金桂湖华彬万达美华度假酒店正式开门迎客。作为万达生活方式品牌(含万达颐华酒店、万达美华酒店和万达悦华酒店)在华时间:2026-05-27
- 华为 nova 16 系列官宣:时代少年团代言,nova 十周年重磅大招来袭5 月 22 日消息,数码博主「定焦数码」透露:华为 nova 16 系列将于下周官宣,全系列定档 6 月份正式发布;本次 nova 16 系列的时间:2026-05-27
- 老人牵狗横穿马路被撞身亡,交警认定双方负同等责任5 月 22 日消息:今年 3 月 13 日下午,四川省绵阳市城南路发生一起交通事故——一名八旬老人遭车辆碰撞,经抢救无效不幸身亡。据了时间:2026-05-27
-
播放量破亿吊打内娱!陈泽野生综艺为何全网催更第二季?声明:本文源自微信公众号新榜,作者:晓雅,获授权由站长之家转载发布。三期视频累计点赞量超1688万,抖人有自己的综艺。最近,在抖音拥有时间:2026-05-27
热门阅读
-
哥哥抚慰腮腺炎弟弟 得知传染秒变脸
阅读:122
-
华为FreeClip 2推送鸿蒙OS 6晋级,支撑星闪音频 抗搅扰才能提拔
阅读:86
-
95岁广东白叟扮演一字马火了 自己谈长命诀要,1天喝2瓶可乐
阅读:64
-
刘文祥塌房紫薯精改吃大理寺米线 网友,筹办整理升咖
阅读:56
-
这才是东北春季最霸气的开场,百万只大雁春季迁移
阅读:54








