🦉

Owl TTS

一款完全免费的智能语音合成工具,全面支持 WindowsAndroid 双端体验。基于小米 MiMo 大模型,支持预置音色、音色设计与声音复刻,一站式完成从文本到高质量语音的全流程制作。

🎁 完全免费 中英双语 MiMo v2.5 TTS 限时免费 多说话人 SRT / CSV 音色工坊
了解更多 ↓

核心功能

Owl TTS 围绕语音合成场景打造,从文件解析到音频合成,覆盖完整工作流。

智能文件解析

自动识别 CSV 与 SRT 字幕文件,智能匹配说话人、时间戳与文本字段,快速导入大量台词。

多说话人映射

为不同角色分配不同音色,支持预置音色和自定义音色混合使用,一键配置多角色对话。

高质量语音合成

基于 MiMo v2.5 TTS 大模型,生成高品质音频,自然流畅、富有表现力。

音色工坊

内置音色管理器,自由创建、编辑和复用音色预设,支持风格标签精细化控制语气情感。

音频合并导出

将多段合成结果自动拼接为完整音频,支持按 SRT 时间戳对齐,保留原始节奏与间隔。

桌面级 UI 体验

macOS 设计风格,深色 / 浅色主题自适应,桌面端自定义标题栏,拖放文件快速导入。

三种合成模式

灵活适配不同场景,从即选即用到深度定制。

预置音色

mimo-v2.5-tts

内置多种中英文高品质音色,开箱即用,适合快速配音和内容生产。

  • 中英文多风格音色
  • 支持风格标签叠加
  • 支持二次设计

音色设计

mimo-v2.5-tts-voicedesign

通过自然语言描述音色特征,AI 自动匹配生成独一无二的声音,创意无极限。

  • 自然语言描述音色
  • 无限音色组合
  • 精确风格控制

音色复刻

mimo-v2.5-tts-voiceclone

上传一段参考音频,AI 即可克隆目标音色并用于任意文本合成,高度还原声音特征。

  • 参考音频一键克隆
  • 支持 WAV 格式
  • 保留说话人特色

工作流程

五步完成从文本到成品音频的全流程制作。

1

生成台词

使用 Owl Meeting 等工具提取录音文本与时间戳,导出为 CSV / SRT 文件。

2

导入文件

拖放或选择 CSV / SRT 文件,自动解析台词与时间戳。

3

配置角色

为每个说话人分配音色与风格标签,个性化定制语气情感。

4

一键合成

批量提交合成任务,实时查看进度,支持中途取消与重试。

5

导出音频

合并为完整 WAV 文件,可按时间戳对齐,分享或下载。

下载链接

即刻下载,体验高效的语音合成与台词生成工作流。

Owl TTS 智能语音合成工具

Windows
微软商店获取(免费)
Android
下载 APK 文件(免费)

Owl Meeting 语音转文本工具(生成SRT\CSV文件)

Windows
微软商店获取(免费一个月)
Android
下载 APK 文件(免费)