
TTS
Text-to-Speech
使用 Bert-VITS2 构建中文(普通话)语音合成系统
基于 AISHELL-3 数据集和 Bert-VITS2 框架开发普通话语音合成系统的研究报告。
Boxuan Lyu - Tokyo Institute of Technology
2 min
20篇文章

基于 AISHELL-3 数据集和 Bert-VITS2 框架开发普通话语音合成系统的研究报告。

基于 Llama 3.1 的英中双向翻译 RAFT 方法探索

通过 DER 分析和实时应用开发,对说话人分离框架进行比较评估。验证 Pyannote.audio 与 Nvidia NeMo 之间的性能差异。
利用自注意力模型识别英语口语中音节重音级别的研究

利用 TF-IDF 检索为 GPT-4 翻译提供更优质的 In-Context Learning 示例,从而提升翻译性能的研究报告。

基于多种评估指标和5个基准翻译模型,对机器翻译质量进行综合评估与改进的研究