[ 导读 ] 卷价格,卷应用,火山引擎能否借大模型东风收割云市场?
近日,字节跳动自研豆包大模型家族产品首次亮相,包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等九款模型。
“豆包家族”并不是第一次发布,而是整合升级了此前字节跳动的云雀大模型和一系列细分模型,统一为一个体系。
据了解,豆包家族将通过字节跳动云计算业务火山引擎正式“营业”,值得注意的是,在现场火山引擎的大模型服务全矩阵图中,底层的大模型服务已经由此前的多个第三方大模型(MiniMax、百川等),全部替换为了豆包家族。
2024年大模型落地元年,大模型将在越来越多的企业场景中,从PoC(验证性测试)走到真实的生产系统。
“不过,落地过程中,仍面临着模型效果不够好、推理成本高、落地应用难等挑战。”火山引擎总裁谭待表示。
激烈的竞争和迫切的需求之下,各家大模型和云厂商都拿出了自己的杀手锏。
随着豆包家族的就位,火山引擎也打出了一张自己的“杀手锏”——降价,将大模型的计价从以“分”计带到以“厘”计的阶段。
以豆包通用模型pro-32k版为例,模型推理输入价格仅为0.0008元/千Tokens,而市面上同规格模型的定价一般为0.12元/千Tokens,是豆包模型价格的150倍。
也就是说,豆包通用模型比行业便宜99.3%。
据火山引擎公布的价格计算,一元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》。
谭待认为,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。
事实上,在云计算领域,以价换规模,是近两年来云厂商们的主流做法。
火山引擎作为云计算领域的后来者,从成立之初就一直致力于成为国内的第四朵云,但时至今日,火山引擎在云市场份额统计表中仍属于Other。
现如今,在大模型刚刚落地应用初期,火山引擎就直接开“卷”价格战,想要以大模型落地来抢占云计算市场份额。
就像谭待对光锥智能表示:“大模型尚未真正大规模落地,只要把价格降下来就还有机会。火山引擎最重要的,就是如何把最佳实践做好、市场做大。”
字节跳动产品和战略副总裁朱骏
棒球帽、T恤和短裤,字节跳动产品和战略副总裁朱骏的这身日常着装,像是刚从公司开完上一个日常沟通会,就上了火山引擎的发布会。
他还用自己没有西装的梗,让大模型做了一张宣传照,批评现在大模型的华而不实。
朱骏的不拘一格,也是字节文化的体现,在拘谨的ToB赛道里格外显眼。朱骏的实用主义和产品价值观也在豆包家族上体现的淋漓尽致。
在朱俊看来,大模型不只是服务器上的一堆代码,而是需要找到最适合的应用形态,以足够自然的交互形式,才能够让更多用户用起来。
相比于其他厂商,字节跳动做大模型的思路,是以做产品的思维,先推动豆包产品用户规模的增长,从而带动大模型能力的提升。
这个思路非常实际,近期一众ToC的大模型应用,也都在疯狂砸钱做增长。同时,在具体产品应用方向上,则更贴近用户。
此前,字节跳动的通用大模型并不叫豆包,而是叫“云雀大模型”。去年,字节跳动内部准备开发大模型产品时,需要为产品取名,最终被命名为豆包。
朱俊现场讲述了最后取名为豆包的三个原则:拟人化、离用户近,以及个性化。
从改名这件小事,其实我们就能够看出字节跳动在大模型落地过程中,现阶段的主要打法之一,是基于大模型的能力,构建更像人,也更懂人的智能体,并使其成为人类的AI助手。
如北京一个五年级的小学生,通过火山引擎旗下的扣子开发平台,开发出了一个青蛙外教智能体。现在,这个小朋友不仅自己使用青蛙外教学习英语,还分享给她的同学和朋友们一起使用。
去年,飞书也上线了基于豆包大模型开发的智能伙伴,目前每天都有大量的企业员工通过飞书的智能伙伴进行工作总结、会议纪要和知识辅助。
朱骏也表示:当前虽然技术在快速演化,但用户核心的需求没有改变,包括高效获取信息、工作提效、自我表达、社交娱乐等等。
与此同时,为了满足不同场景中对智能体的不同需求,此次豆包大模型是以家族矩阵式亮相,不同的大模型,可以满足不同的场景需求。
豆包大模型有两款通用大模型,其中豆包通用模型pro是主力模型,具备理解、生成、逻辑、记忆等强综合能力,支持128k长文本精调,且支持问答、总结、分类、创作等丰富的场景。
在长文本理解的场景中,豆包可以总结分析上传三篇论文中的亮点,还可以让它触及和论文相关的题目,来考察其是否对文档、论文等有非常清楚的理解。
“豆包pro模型非常强大,但在有些场景里,用户对延时和成本会非常敏感,这个时候,豆包通用模型lite是大家更好的选择。”谭待如此说道。
豆包通用模型lite是更具性价比的通用模型,千Tokens成本降低84%,延迟降低50%,它支持闲聊、天气及实时信息查询、音乐视频播放、导航等场景,效果领先传统语音处理50%以上。
如智能汽车的座舱交互,就是一个非常适合lite模型的应用场景。通过豆包lite,汽车厂商可以在低延迟下实现对话,支持闲聊、搜索、娱乐、导航、车控等多个座舱智能助手场景,效果要比传统语音处理高50%以上,让汽车变得更“聪明”。
除了通用大模型外,火山引擎还发布豆包角色扮演模型、语音系列模型、文生图模型、Function call模型、向量化模型等其他细分领域模型。
其中,角色扮演模型支持角色高度定制,能够基于上下文感知自适应用户扮演或陪伴需求,且具有强剧情推动能力,能够持续引导聊天。
豆包语音系列模型中:
豆包声音复刻模型支持5秒复刻,跨语种迁移,与原声具有高相似度。
按照以往字节跳动产品发布的情况来看,基本都是已经在内部经过多个业务线进行测试,并已经相对成熟的产品,才会拿到市场中做泛化应用,如飞书、火山引擎。
字节跳动去年开始加速大模型的研发,谭待现场表示,过去一年中,字节内部50多个业务已大量使用豆包进行AI创新,包括抖音、头条、番茄小说等多个产品。同时基于豆包大模型打造的同名豆包APP,在苹果APP Store和各大安卓应用市场,下载量一度在AIGC类应用中排名第一。据朱骏透露,豆包上已有超过800万个智能体被创建,月度活跃用户达到2600万。同时,火山引擎也以邀测的方式,和不同行业的头部客户对基于豆包大模型进行深度共创,包括手机、汽车、金融、消费、互娱等等领域。“好的技术,一定是在大规模应用,在不断应用情况下不断打磨才能形成的。大模型也一样,只有在真实场景中落地,用的人越多,调用量越大,才能让模型越来越好。”官方数据显示,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。“这么大的使用量,这么多的场景,让我们觉得一切已经就绪。”谭待的这句话,无疑表露了字节跳动大模型要向企业端落地应用的决心。豆包家族的首次亮相,可以看作是字节跳动大模型发展的转折点,即经过内部AI产品赛马之后,字节收拢了经过产品验证的大模型能力,并通过与火山引擎的结合,开始全面做增长。
于火山引擎而言,相比较目前主流云厂商们来说,受制于字节本身大模型开发节奏问题,火山引擎在自研大模型的应用上的步伐,始终迟了一步。
迟来的开局,B端业务的“慢”特点,让火山引擎没办法像短视频一样,快速实现弯道超车。但从豆包的能力,和火山引擎当前大模型落地的思路来看,其与行业头部的差距,正不断缩小。“一定要降低门槛去做。”谭待对光锥智能说明了火山引擎推动大模型向B端落地应用的策略,降低门槛,不光是价格上的降低,更重要的是能够大模型能够更简单快速的实现落地应用。AI应用开发平台“扣子”,是火山引擎加速大模型快速落地应用的关键抓手。目前主流云厂商和大模型企业,都在推AI应用开发平台,比如阿里云的魔搭、百度的千帆等等。