在4月17日的火山引擎 AI 创新巡展杭州站上,字节跳动旗下的火山引擎总裁谭待正式发布了最新的豆包1.5・深度思考模型。此次发布会吸引了众多行业人士的关注,谭待在会上分享了该模型在多个领域的优异表现。

据悉,豆包1.5模型在数学、编程、科学推理等专业领域,以及创意写作等任务中,都展现出了卓越的能力。这款新模型采用了 MoE(混合专家)架构,总参数达200亿,而激活参数仅为20亿,显著低于行业同类模型的参数规模,因而在推理成本上也具备了明显的优势。
谭待还详细介绍了豆包1.5深度思考模型的强大功能,包括结合视觉理解技术提供的多种应用。这些功能不仅可以根据照片分析地貌,还能在旅行时帮助用户点餐,甚至能辅助企业完成项目管理流程图。
此外,火山引擎还对豆包文生图模型进行了3.0版本的升级。此次升级带来了更美观的文字排版、更精细的图片生成能力以及2K 图片的直出能力。用户能够享受到更加丰富的视觉体验。
更值得注意的是,新模型的视频搜索能力得到了提升,用户在进行搜索时,模型能够在视频中迅速找到相关的答案。这一功能极大地提升了用户获取信息的便利性。
根据谭待的介绍,豆包大模型的使用量正以惊人的速度增长。截至2025年3月,豆包大模型日均 tokens 的使用量超过了12.7万亿,相比于发布初期,增长幅度超过了106倍。这一数据充分反映了豆包模型在市场上的受欢迎程度。
划重点:
📈 豆包1.5模型在多个专业领域和创意写作中表现出色,采用先进的 MoE 架构,参数配置优越。
🌍 新模型结合视觉理解技术,可分析照片、辅助旅行和项目管理,功能强大。
🎥 视频搜索能力显著增强,用户可快速获取视频中的相关信息,使用量持续增长。