
文 | 字母 AI桂林锚索钢绞线
离开 DeepSeek 的郭达雅,成为大厂争夺的焦点(详见《为什么大厂须郭达雅》)。
如今郭达雅的去处尘埃落定,据误点音信,字节成为这场争夺战的告捷者。
郭达雅但是 AI 圈的大红东说念主,网富贵传着种说法,阿里给出了 post-train 雅致东说念主的职位,腾讯和百度也都开出了很的价码。
可郭达雅后偏巧取舍了字节。
要知说念,字节在多模态上一经作念到群众先,Seedance 2.0 曾问鼎在各样生成名次榜,可郭达雅磋商的向显著和这块有点远。
让东说念主爱慕的是,就算如斯,字节还甘愿给郭达雅开出接近亿元年包的待遇(对此音信,字节总裁暗示作假)。
谜底藏在字节近半年的系列动作里。
2026 年头,字节启动了针对 agent 和 Coding 的组织整。
梁汝波在全员会上说,2026 年的重中之重是 AI 模子才能要作念到行业前线。从 Trae 立拆分 SOLO,再到扣子平台升到 2.5 版块。这些动作指向同个向:字节在为 agent 期间作念准备。
而郭达雅,恰好是懂若何让 agent 跑起来的东说念主。
01 字节有短板
字节的多模态才能很强,吴永辉、周畅、郁博文、蒋路这些大牛持续加入 Seed 团队,他们给字节带来了套完好意思的多模态研发体系。
但字节在数学理、代码智能和 agent 这三个朝上,恒久没能建立起显著势。
Seed 2.0 在 AIME、HMMT、IMOAnswerBench 这些竞赛型题目上很猛,好多分数一经站在了群众的梯队。
但是要是往科学理和绽放常识任务上看,你会发现存好多问题。
Seed 2.0 在 GPQA Diamond 上过时于 GPT-5.2 和 Gemini 3 Pro,在 SuperGPQA 上也低于 Gemini 3 Pro 和 Claude Opus 4.5。
显著的是 SimpleQA Verified 和 FactScore 这类事实准确预备,Seed 2.0 和 Google、OpenAI、Anthropic 这些企业的端模子还有不小距离。
这表现它的竞赛解题才能一经很强,但常识持重、科学问题里的长链条判断、以及"知说念我方不知说念什么"的才能,还差燃烧候。
再看 AI 编程。
Seed 2.0 在 Codeforces 和 LiveCodeBench v6 上说明很强,表现算法题和在线编程才能不差。但在 SWE-Bench Verified 上,它低于 Claude Opus 4.5 和 GPT-5.2。Claude Opus 4.5 得分 80.9,GPT-5.2 得分 80.0,而 Seed 2.0 Pro 在这个基准的三实测收获仅为 76.5,甚而还莫得入榜单前 10。
在 Terminal Bench 2.0 上,它也过时于 GPT-5.2 和 Claude Opus 4.5。
在 Multi-SWE-Bench、SWE-Bench Pro、SWE-Evo、Aider Polyglot 这些接近确凿软件工程和历久真贵的预备上,Seed 2.0 的排名都不。
这些确凿环境的测试很紧迫。尤其是关于 Trae 这种 AI+IDE 的产物来说,能在这些测试里跑出分,代表你的产物能在复杂神情里不犯错,况且还具备回滚、考证、解释的才能。
后即是 agent。
其实字节不是莫得 Agent 才能,甚而是说 Seed 2.0 的搜索、使用器用、视觉 agent,它都跑出了可以的收获。
它在 BrowseComp、BrowseComp-zh、DeepSearchQA 上说明超过,表现 Seed 2.0 的搜索、浏览和整理信息才能一经极端可以了。
但是,但旦换成 MCP-Mark、VitaBench、SWE-Evo、SWE-Bench Pro 这类锻真金不怕火模子历久推论、多器用组、确凿末端操作、复杂软件工程才能的基准,Seed 2.0 的说明就不太行了。
这其实也恰是 agent 难作念的地,你得谐和地去线路方向、铲除名务、调用器用、写代码、考证服从、在失败后修正道路。
可问题即是,它禁绝易发掘。要是说是多模态上的问题,把狗画成了猫,眼你就能看出来。agent 不样,它是藏在那些又繁琐又聊的才能里的。
就拿 SWE-Bench Verified 来说。这个测试是把确凿 GitHub 神情里的 issue 交给模子桂林锚索钢绞线,让它读仓库、定位关联文献、修改代码,再用神情原有测试判断补丁能不可通过。
这里莫得哪步是炫技,全是工程里的脏活累活。
模子要是启动线路错 issue,背面改得越多越偏。要是找对了文献却漏了个规模条目,测试照样过不了。要是只修现时报错,又引入新的回来,后也算失败。
agent 的难点就在这里,中间你只好错步,通盘这个词任务就会塌。
那数学和代码才能为啥也很紧迫呢?
因为它们是 agent 的骨架。
数学理提供的是长链路上的自洽才能,代码才能提供的是把观点变成可推论动作的才能。
是以郭达雅的加入,补的是底层才能。
字节已有眼睛,有进口,有场景,有算力和工程组织。它欠缺的,是个能把代码智能、数学理、强化学习后践诺和 Agent 推论连成条线的东说念主。
02 郭达雅擅长的,不仅仅写代码
郭达雅容易被外界用"代码大模子"来玄虚,这个说法没错,但有点窄。
他的磋商总结即是句话:让模子线路代码也有语法,罕有据流,有调用关系,有高下文,还有可以被推论和考证的服从。
郭达雅在 DeepSeek 的两年多时候里,参与了从 Coder、Math 等项模子,到 V2、V3、R1 的完好意思研发链条,而且都是中枢作家。这个资历的含金量不在于神情数目,而在于他参与的是条完好意思的时刻演进道路。
2024 年 1 月,郭达雅动作作家出 DeepSeek-Coder 系列,障翳 1.3B 到 33B 参数的开源代码模子。这个系列在多项基准测试中登顶其时开源代码模子 SOTA,不仅能线路复杂代码逻辑,还能生成质地代码。
但 DeepSeek-Coder 的价值不啻于此。它为 DeepSeek 在代码域站稳脚跟奠定了基础,紧迫的是,它考证了套从数据构建、模子践诺到才能评估的完好意思法论。
个月后,郭达雅主了 DeepSeek-Math 的研发。这个神情以 DeepSeek-Coder-Base-v1.5 7B 为基础,针对数学才能进行持续践诺,至极使用了 120B 数学关联 token。
但确凿要害的是 DeepSeek-Math 论文中提议的 GRPO 算法,让模子对同问题生成多个谜底并互比较较学习,大幅缩短了践诺资本。
GRPO 其后被应用到 DeepSeek-R1 的践诺中,钢绞线成为 R1 理才能飞跃的中枢时刻,因此让 DeepSeek-R1 的践诺资本低至仅 29.4 万好意思元。
从 DeepSeek-Coder 到 DeepSeek-Math,再到 R1,郭达雅作念的是套可以迁徙、可以复用的时刻体系。这个模子可以用,拿出来化化,到下个模子果好。
代码才能可以迁徙到数学理,数学理的践诺法可以迁徙到通用理。这种时刻迁徙才能,恰是字节目下需要的。
郭达雅加入字节后,担任的是 Seed agent 的向雅致东说念主之。这其实亦然郭达雅从博士期间就启动磋商的向。他在 DeepSeek 期间蕴蓄的教唆,可以成功应用到字节的 agent 研发中。
字节在 2026 年头启动了针对 agent 和 Coding 的组织整。
但它又不是那种单纯的团队并,字节是准备去建立套新的研发体系。郭达雅的加入,为这个体系提供了时刻基础。
他可以把在 DeepSeek 蕴蓄的代码预践诺、数学理、强化学习这些时刻,系统地应用到字节的 agent 研发中。
郭达雅的时刻道路与字节的业务需求度匹配。字节的下代模子即是 agent 才能的化。
郭达雅从博士时期的 CodeBERT 启动,到 DeepSeek-Coder,再到参与 V2、V3、R1 的研发,这条时刻道路完好意思障翳了从代码线路到理才能的全链路。这恰是字节需要的。
紧迫的是,他带来的不仅仅时刻,还有套完好意思的法论。
GRPO 这个法的中枢念念想是让模子我方学会判断谜底的利弊,而不是依赖东说念主工标注。到了其后的 DeepSeek-R1 里,不需要东说念主工标注的理轨迹,仅通过纯强化学习也能有激励大模子的理才能,并当然深刻出自反念念、考证、动态策略退换等活动形状。
这套法论对字节的价值在于,它可以缩短对证地标注数据的依赖,可以让模子在践诺进程中我方发现限定。
前边我一经说过了,agent 是在跑的时候任何个要害都不可出错,责罚的任务不时是绽放式的,很难通过东说念主工标注来障翳通盘情况。
要是能让模子我方学会判断任务完成的利弊,我方学会退换策略,那 agent 的才能上限就会大幅进步。
郭达雅离开 DeepSeek 的个原因是他很看好 agent 向,不外其时在 DeepSeek 里面 agent 的先不。这才致他终取舍了字节。
字节则极端垂青 agent 向,甘愿参预资源,给了郭达雅饱和的施展空间。
03 往日可能出现的产物,不会仅仅款聪惠的豆包
郭达雅加入字节后,成功的影响会体目下豆包的代码才能上。
字节目下一经有了 Trae 这个 AI 原生 IDE,也有豆包 Code 模子,但这些产物的底层才能还不够强。
参考 DeepSeek-Coder 的能进步法,字节很可能会出个门针对代码化的豆包 Coder 模子。这个模子不会是通俗的参数堆叠,而会在代码线路和生成的度上作念著述。
郭达雅在 CodeBERT 和 GraphCodeBERT 中提议的双模态预践诺和数据流结构建模,可以成功应用到豆包 Coder 的践诺中。
手机号码:15222026333火山舟出了 Coding Plan 订阅套餐,维持豆包、DeepSeek 和 Kimi 等多个模子,罗致 Anthropic 原生条约,配置通俗。
不外目下来看,火山舟多的是在作念模子接入和工程化,走的是多模子聚 + 工程化化的蹊径,还莫得造成我方的时刻壁垒。
火山的套餐里有个 Auto 形状,即是说你发起个编程任务后,它会凭据任务类型、反应速率、模子果、资本等要素,自动路由到适的模子。
这个才能自己灵验,但还偏工程化。它知说念哪个模子相宜前任务,却不定能把这个判断千里淀成模子才能。
郭达雅加入后,它能把 Auto 形状产生的大宗确凿拓荒任务,反过来变成 Doubao-Seed-Code 的践诺燃料。
比如某类前端重构任务 DeepSeek 稳,某类测试成就 Kimi 好,某类末端任务豆包失败率。
平台要是能记载任务类型、模子取舍、补丁是否通过测试、用户是否罗致、失败原因在那边,就能造成个很稀缺的代码 Agent 数据闭环。
郭达雅擅长的可考证任务,恰好可以把这些反馈变成后践诺系统。
这么来,火山舟的壁垒就变了。
它把外部模子接进来,然后在确凿拓荒场景里握续不雅察模子、比较模子、践诺模子。
别东说念主的多模子聚,停在分发层;字节的多模子聚,有契机长出个自我进化的代码模子。
还有点,由于火山目下的 Coding Plan 的界说是面向个东说念主拓荒者的轻量 AI 编程订阅做事。是以郭达雅有契机带字节拓荒出个企业版的 Coding Plan。
但是企业和个东说念主对 AI 编程的需求差距大好多。
企业要的是旧系统真贵、代码迁徙、测试补皆、安全成就和里面器用拓荒。火山舟可以出个雷同"代码库医师"的 agent 产物。
agent 接入企业代码仓库后,自动扫描依赖、识别坏滋味、补单测、修缺陷、作念版块升,青年景可审查的 PR。
针对大型代码库的历久线路、测试反馈的迭代行使、企业权限与数据安全的规责罚,恰是郭达雅的时刻签订,他可以造出款能历久真贵神情的工程化 agent。
同期,字节在生成上的势,也可以和代码才能结。
个可能的向是骨子的步伐化生成,就像寰球模子样。用户描画想要的果,AI 生成段可以已毕 Seedance 的代码。
这段代码可以精准已毕镜头融会、场景切换、音画同步等参数。这种步伐化的式,可以让生成加可控,也容易迭代化。
数学理才能的进步,会让豆包在需要精准磋磨和逻辑理的场景中说明好。
字节还可以出个门针对科研和工程场景的豆包版块,就像 OpenAI 的 Prism 样,维持复杂的数学建模、数据分析、算法联想等任务。
这个版块可以集成神气化表现注解才能,确保理进程的严格。这关于金融、医疗、工业等对可靠要求的行业极端紧迫。
郭达雅的加入,不是通俗的东说念主才引进,他体现出来的是字节在 AI 战术上的退换。字节在多模态上一经作念到了群众先,目下需要在代码智能和 agent 上建立雷同的势。
相关词条:管道保温施工 塑料挤出设备 预应力钢绞线 玻璃棉厂家 保温护角专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。