自研视频模型亮相,百度“对战”快手字节胜算?


百度商业体系商业研发总经理刘林阐述了数字内容创作领域的新进展。他指出,视频时长与画质的提升,是创作自由度实现质变的关键。MuseSteamer作为创新工具,能够生成具有电影级审美的10秒长视频,且清晰度达到1080P,为视频创作者开辟了更广阔的创作天地。 在传统AIGC视频创作中,流程往往繁琐,先制作视频再配音加音效,这种割裂的创作方式不仅耗时,还可能影响作品的艺术完整性。MuseSteamer则实现了突破,它能一体化生成包含音效和人物台词的视频,极大提升了创作效率。 此外,MuseSteamer目前支持生成5秒和10秒两个版本的视频,均能达到1080p的高清标准。百度还同步发布了MuseSteamer模型的家族系列,包括Turbo、Lite、Pro等版本及其有声版,以满足不同创作需求和成本控制。 刘林强调,MuseSteamer的核心优势在于其对创作指令的精准理解和高效执行,即“极致遵循力”,让创作者能够“所思即所得”。同时,其出色的镜头运用能力也是一大亮点,百度旨在通过这一模型降低专业创作门槛,使更多人享受到“镜头平权”。 在技术层面,MuseSteamer的成功得益于三大方面:一是数据准备阶段,通过严格筛选、净化和配比超过10亿条异构数据,结合三级标签体系和主动学习机制,确保训练数据的审美和结构质量;二是模型训练过程中,采用多目标反馈的强化学习路径,保持视频动作幅度与内容一致性的稳定输出;三是引入美学条件控制调优,通过隐式批判学习和影视标准严选,使模型具备审美和创造能力。 尽管百度在文生视频领域属于“后发者”,但其在AI大模型领域的深厚积累为MuseSteamer的推出奠定了坚实基础。自2023年起,百度已发布并迭代多个版本的文心大模型,并在多个业务线中落地应用。此次推出MuseSteamer,标志着百度在视频生成这一AIGC爆发点上迈出了重要一步。 值得注意的是,尽管市场上已有多个竞争对手在文生视频领域取得显著进展,但百度凭借其在AI技术方面的深厚底蕴和创新精神,有望在这一领域取得突破。未来,随着技术的不断进步和应用场景的拓展,MuseSteamer有望成为更多创作者的首选工具,推动数字内容创作行业的繁荣发展。
烟台三明网络专注软件开发10年+,具备烟台APP开发、烟台小程序定制、烟台公众号定制、烟台网站建设、烟台商城开发、烟台分销系统开发、烟台康复系统开发,致力烟台互联网+行业的系统定制开发与运营,为企业发展提供助力。