能看懂、听懂,豆包Seed 2.0 Lite晋级,首款全模态了解模子
时间:2026-05-07 09:42:30
小编:china
阅读:
5月6日消息,今日,火山引擎宣布,Doubao-Seed-2.0-lite升级新版本,这是豆包大模型家族首款全模态理解模型。
据介绍,新版Doubao-Seed-2.0-lite支持视频、图像、音频、文本的原生统一理解,Agent、Coding与GUI能力也同步升级,进一步面向复杂业务场景增强多模态推理能力。
在视觉理解方面,Doubao-Seed-2.0-lite继续大幅提升,在物理HiPhO、医疗MedXpertQA等高阶学科推理任务上,新版本表现已大幅超越今年2月发布的Doubao-Seed-2.0-pro。
同时,该模型在细粒度感知BabyVision、WorldVQA,以及具身理解ERQA等关键领域达到SOTA水平,更适合企业在高价值场景中进行规模化部署。
加粗表示最优结果,下划线表示次优结果
此次升级的一大重点是融入语音理解能力,新版本可同时理解多种输入模态,并完成跨模态联合推理,能够直接处理那些必须音画结合”才能判断的复杂业务需求。
例如在视频理解场景下,Doubao-Seed-2.0-lite可以联合分析视频画面与音频信息,精准判断视频中的视听一致性,也就是看到的”和听到的”是否匹配。
它还支持根据自然语言指令,在视频中精准定位特定事件发生的时间点,并能跨越多个时间段提取关键线索,持续追踪人物与事件发展,基于画面进行多步逻辑推理,还原事件关系与行为脉络。
音频能力方面,新模型支持19个语种的精准语音转写,以及中英文与其他14个语种互译。
此外,它还能捕捉语音中的情绪变化、环境背景声与音乐细节,输出更完整、更接近人类认知的语义信息。

根据公开评测集,Doubao-Seed-2.0-lite在语音识别、翻译等多项音频理解基准上优于Gemini-3.1-Pro。
值得一提的是,Doubao-Seed-2.0-lite还深度适配OpenClaw、Hermes Agent等框架,强化深度搜索与Skill动态调用,可在执行任务过程中持续沉淀经验,实现越用越聪明”。
-
能看懂、听懂,豆包Seed 2.0 Lite晋级,首款全模态了解模子5月6日消息,今日,火山引擎宣布,Doubao-Seed-2 0-lite升级新版本,这是豆包大模型家族首款全模态理解模型。据介绍,新版Doubao-Seed-2 0-时间:2026-05-07 - 小狗靠捡瓶子攒10万 主人回应,大部份来自短视频收益5月7日消息,据报道,广州法斗小狗小白因常年捡瓶子走红网络,甚至有传闻称它已经靠这一技能攒下了10万元。面对大家的关注,小白的主人对此时间:2026-05-07
- 婚车为赶场将新人丢在高速上 过路宾利车主仗义收费突围5月6日消息,近日,黑龙江牡丹江发生一件暖心又离谱的事:一名宾利车主在途经高速路口时,偶遇一对新人被婚车半路丢下,随即主动伸出援手,时间:2026-05-07
- 小狗靠捡瓶子攒10万?主人回应,大部份是拍视频赚的广州有只法斗犬,叫小白,因为一个特殊技能走红了——捡瓶子。网上甚至传言,它靠捡瓶子已经攒下了10万块钱。最近,小白的主人出来澄清了。时间:2026-05-07
- 婚车赶场将新人丢下 宾利车主救场 网友,这才是真格式结婚当天,被自己的婚车丢在高速路口,这种事你敢信?黑龙江牡丹江一对新人,还真就遇上了。据开宾利的车主讲述,他那天驾车经过高速口,发时间:2026-05-07
热门阅读
-
哥哥抚慰腮腺炎弟弟 得知传染秒变脸
阅读:116
-
华为FreeClip 2推送鸿蒙OS 6晋级,支撑星闪音频 抗搅扰才能提拔
阅读:80
-
95岁广东白叟扮演一字马火了 自己谈长命诀要,1天喝2瓶可乐
阅读:48
-
刘文祥塌房紫薯精改吃大理寺米线 网友,筹办整理升咖
阅读:47
-
这才是东北春季最霸气的开场,百万只大雁春季迁移
阅读:46








