谭待端上字节AI全家桶,这次是真能打

谭待端上字节AI全家桶,这次是真能打

文 / 梁添 

来源 / 节点AI 

6月23日,火山引擎一年一度的FORCE大会。

如果用一句话概括发生了什么,那就是,字节把AI全家桶摆上桌了,补上了coding能力,还顺手把价格打到了地板上。

豆包大模型2.1 Pro正式发布,编程能力追平Claude Opus 4.7,价格只要对方的20%。视频模型Seedance 2.5直接生成30秒视频,还带了一个音频模型和升级图像模型。

火山引擎总裁谭待也交了一组成绩单,截至今年6月,豆包大模型日均Token调用量180万亿,两年增长1500倍。公有云市场份额49.5%,几乎占了半壁江山。年消费超1万亿Token的企业客户从100家翻到了200家。

数字很炸。

但今天真正值得聊的,不是哪个评测又出了高分,而是字节在AI这件事上,长板更长,也补齐了短板。

发力编程和Agent

谭待端上字节AI全家桶,这次是真能打

过去一年,字节一直是一个ai赛道优秀的偏科生——多模态第一,豆包app在C端热度高涨,Seedance视频模型更是吊打全场,可惜,一到编程考试就插不上话。

2025年恰好是AI Coding爆发的一年。Anthropic凭借编程和Agent能力甚至把OpenAI都甩在了后面。Cursor成了开发者标配工具,小龙虾把大众对Agent的理解往前推了一大步。

现在这条最热的赛道上,字节终于发力了。

这次豆包2.1 Pro就是来补课的。具体跑分就不一一念了,总之在主流编程和Agent评测里基本都进了全球前三。

更直观的是现场那个案例,豆包2.1 Pro接了一个芯片设计的活,连续跑了18小时、9轮迭代,跑通了仿真测试,这种活正常要3到5个资深工程师干好几周。一个模型顶一个工程师小组。

另一个例子是 3D 虚拟城市场景。依托豆包 2.1 Pro 搭建的系统,可以实现 500 余个智能 Agent 同步协作,完成上千轮工具调用,生成超百栋建筑。

看完给我的感受就是,在Coding领域豆包终于上桌了。

字节做AI的风格一直很字节,你做什么我也做,但我要做到更便宜。

豆包2.1 Pro定价:输入6元/百万Token,输出30元/百万Token,缓存命中1.2元。综合成本比Claude Opus系列便宜接近80%。高频调用的Turbo版价格再砍一半。

考虑到多模态能力的差距,这个价格在当前市场上还是很能打。

谭待在大会上讲了一个我觉得挺有意思的逻辑:不要只看Token标价,要看Token能创造的业务价值。

他的判断是,虽然主流模型单Token价格在涨,但单Token创造的业务价值涨幅更大,整体性价比其实在提升。这话翻译一下,我们涨价了,但你赚得更多了,所以你应该觉得很划算。

他举了一个有说服力的例子。Seedance 2.0上线前,视频生成模型的周末调用量远高于工作日,说明大家当玩具用。上线之后,工作日调用全面反超周末。制造业、自动驾驶、具身智能的企业,开始把视频生成真正嵌入生产流程。

用户行为从周末玩变成周一到周五用,这可能是证明AI从玩具变成工具最直接的数据。

视频生成的天花板又被拉高了

谭待端上字节AI全家桶,这次是真能打

多模态是字节最有底气声量最大的赛道。要知道去年多模态还是Google的天下,但今年年初Seedance2.0横空出世,字节一跃成为多模态领域的天花板玩家。这次也没让大家失望。

从预告看,Seedance 2.5实用性更强了。单条视频最长达到了30秒,支持最多50个全模态素材联合输入,还新增3D白模预演能力。

据说灵感来自一位知名导演,他在合作中提出,科幻片和大场景调度里3D白模是前期预演的核心工具,但传统制作太费时费力,Seedance据此开发了这个功能。

同时,Seedance 2.0在画质上也升级到了原生4K直出,这个水准已经可以进入专业影视后期。

此外还有两个新模型,Seedream 5.0 Pro,新增了交互式精准编辑和多图层分离;豆包音频模型1.0支持根据文本自动推理角色声音,一次生成包含对白、音效、背景音乐的完整音轨。现场还演示了一段古风武侠片,从人声到兵器碰撞声全部AI生成,一分钟,音色不漂移。

一场发布会,字节把文字、图片、视频、音频全模态产品线拉齐了。

大会上还有一个有意思的发布,周星驰《喜剧之王》《食神》《长江七号》三部经典IP授权入驻火山引擎的AI版权商业化平台,用户可以在抖音、即梦、剪映上用官方模板做二创。

这件事的意义重大。对于一直困扰AI视频生成的版权问题,这是一个值得关注的解法。谭待也提到,Seedance 2.0其实春节前就开发完了,但拖到4月才开放API,中间几个月全部用来搭版权保护和人脸管控的安全体系。“安全不是业务的限制,是商业化的前提。”

产业落地方面,名单上的公司也挺有说服力。

特斯拉全系车型基于豆包做智能语音车控,奔驰新款CLA接入豆包支持自然对话,顺丰用AgentKit搭建全场景AI办公助理,新东方做AI助教覆盖口语练习和作文批改,中国石油用安全运营Agent做异常告警自动值守。从车企到物流到教育到能源,字节的AI确实在往各行各业渗透。

如果把今天的发布会浓缩成一句话,大概是,字节终于从多模态很强但编程较弱变成了都不错。

在AI竞争的当前阶段,均衡发展的能力,可能比偏科型更有商业价值。在企业真实采购决策中,一个能看图、能写代码、能做Agent、还便宜,很可能会赢过一个编程满分但什么都看不了的模型。

豆包180万亿日均调用量和49.5%市场份额已经说明了问题,这个数字不是靠评测刷出来的,是企业客户真金白银pick出来的。

谭待说了一句话我觉得挺实在的,国内AI市场大概相当于跑了1公里,刚刚跨过生产级门槛,未来还有十倍甚至百倍的增长空间。

字节跳动在AI上的打法,和它做所有事情一样,不一定是第一个做的,但一定要做到足够大、足够便宜、足够全面。至于这套打法在AI时代还灵不灵,180万亿Token,大概就是市场给出的答案。

*题图由AI生成

节点声明:本内容为作者独立观点,不代表节点财经立场。未经允许不得转载,文中内容仅供参考,不作为实际操作建议,交易风险自担。

(0)
节点财经的头像节点财经
9系的技术8系先用,全新理想L8能掀翻五座SUV市场吗?
上一篇 2026年 6月 24日 14:54
泡泡玛特乐园内测,代购盲盒半天售罄,潮玩界能否闯出迪士尼?
下一篇 2023年 9月 18日 17:01

相关推荐