OpenHub开源社区

OpenHub开源社区专注开源软件分享、开源网站收录与开源社区交流，提供各类免费开源项目、开源工具及开源软件下载，打造优质开源爱好者交流平台。在这里，可以找到最新、最热门的开源项目资源，您也可以分享自己的项目，并与开源爱好者交流。立即加入OpenHub，探索无限可能！

AI视频和音频生成模型

作者: OpenHub
时间: 2025-02-22 12:00:00
分类: 开源软件

阶跃星辰开源了视频生成模型 Step-Video-T2V，

和语音交互大模型 Step-Audio，

Step-Video-T2V 拥有 300 亿参数，可以生成最高 204 帧，约 8 秒的视频。

以下是它的视频生成效果。

Step-Audio 自称是业界首个集语音理解和生成控制一体化的，产品级开源实时对话语言系统，

支持中英日、方言多语言对话，和不同的情感。

同时，还支持音频克隆等功能。

以下，是它生成的一些音频。

Step-Video-T2V：https://github.com/stepfun-ai/Step-Video-T2V

Step-Audio：https://github.com/stepfun-ai/Step-Audio

添加新评论

上一篇: SketchyBar Mac顶部状态栏定制工具
下一篇: linuxpdf 在PDF里运行了Linux