Seed Audio 1.0 不只是把文字读出来,而是把人声、音乐、音效、环境音和多人表演组合成一个完整的声音世界。
独立产品式介绍页;本站暂不提供在线生成能力。

Seed Audio 1.0 的重点不只是朗读文本,而是把人声、音乐、音效、环境音和表演指令组织成完整声音场景。
可用人声、音频、音乐和情绪氛围作为参考,让输出方向不再只是平铺直叙的朗读。
支持多个说话人同处一个场景,适合对白、旁白、短剧和故事表演。
在同一提示中描述背景音乐、动作音效与空间氛围,让声音世界更完整。
单次生成最长约 2 分钟,后续可通过续写延展更长内容,并尽量保持风格和音色一致。
把 Seed Audio 1.0 当作理解完整声音世界的模型笔记,而不是本站提供在线生成能力的承诺。
把页面当作信息地图,理解 Seed Audio 1.0 如何被描述、评估和延展。
先定义内容类型:播客开场、冥想引导、广播剧或短剧配音、短视频配音、有声书或故事陪伴。
加入音色质感、情绪氛围、音乐方向、音效和环境音,让声音以完整场景被构思。
描述说话人角色、节奏、情绪推进和对白轮次,组织多人表演。
用续写思路处理更长内容,并复核一致性、唱歌片段和可能出现的合成或电音感。
理解 Seed Audio 1.0 的最好方式,是看它如何把人声、音乐、音效、环境音和表演意图组合在一起。
主持人口播、短音乐动机、轻微录音棚氛围和转场音效组成完整片头。
平静旁白、缓慢节奏、柔和氛围铺底和细微环境质感,适合沉浸式聆听。
多角色对白、场景环境音、脚步、开门、天气和音乐提示构成表演段落。
带表情的人声方向,配合快速音效、音乐重音和短片节奏。
旁白结合氛围参考、角色片段和轻量环境音,支撑更长故事聆听。
当前 1.0 仍有泛化、唱歌稳定性和偶发合成感或电音感等待提升。
以下仅使用谨慎事实表达,作为 Seed Audio 1.0 的能力提示,而非产品承诺。
单次生成的大致上限
支持包含多个说话人的表演场景
可组合语音、音乐、音效和环境音
可通过续写延展更长内容并保持风格
围绕本站整理的 Seed Audio 1.0 模型笔记,回答几个核心问题。