
Face Recognition
Emotion Detection
面向人脸与情绪识别的视频和音频数据预处理与分析
构建用于面部分析、姿态估计和情绪检测的视频预处理流水线的研究报告。
Aditya Sundar - Waseda University
2 min
VoicePing的见解、技巧和更新
3 / 4

构建用于面部分析、姿态估计和情绪检测的视频预处理流水线的研究报告。

基于 Llama 3.1 的中英翻译微调及幻觉缓解策略研究

基于 AISHELL-3 数据集和 Bert-VITS2 框架开发普通话语音合成系统的研究报告。

基于 Llama 3.1 的英中双向翻译 RAFT 方法探索

通过 DER 分析和实时应用开发,对说话人分离框架进行比较评估。验证 Pyannote.audio 与 Nvidia NeMo 之间的性能差异。
利用自注意力模型识别英语口语中音节重音级别的研究