博客

VoicePing的见解、技巧和更新

1 / 4

离线语音翻译应用:iOS/Android 跨平台端侧转写、翻译与 TTS
Speech Translation On-Device AI

离线语音翻译应用:iOS/Android 跨平台端侧转写、翻译与 TTS

开源跨平台移动端完全离线语音翻译应用,集成端侧 ASR(SenseVoice)、神经机器翻译和 TTS,支持 iOS 和 Android 系统音频捕获

Akinori Nakajima - VoicePing
2 min
语音翻译:英日双向翻译中 Qwen3-ASR 与 Whisper 的对比
Speech Translation On-Device AI

语音翻译:英日双向翻译中 Qwen3-ASR 与 Whisper 的对比

英日双向语音翻译模型基准测试。将 Qwen3-ASR(1.7B 参数,最高质量)和 Distilled Whisper(756M,快 4 倍)与 OpenAI Whisper large-v3 及 Meta SeamlessM4T v2 进行比较。

Akinori Nakajima - VoicePing
5 min
离线 TTS 基准测试:在 Android/iOS 上评测 18 个模型
Text-to-Speech On-Device AI

离线 TTS 基准测试:在 Android/iOS 上评测 18 个模型

涵盖 Kokoro、Piper、Matcha、Kitten 和 VITS 在内的 Android/iOS 端侧 18 个 TTS 模型综合基准测试

Akinori Nakajima - VoicePing
3 min
离线语音转写基准测试:在 Android/iOS/macOS/Windows 上评测 16 个模型
Speech Recognition On-Device AI

离线语音转写基准测试:在 Android/iOS/macOS/Windows 上评测 16 个模型

在 Android、iOS、macOS 和 Windows 上对 16 个端侧语音识别模型和 9 个推理引擎进行的综合基准测试

Akinori Nakajima - VoicePing
6 min
Whisper 生产实践:实时双语切换的踩坑经历与最终架构
ASR Whisper

Whisper 生产实践:实时双语切换的踩坑经历与最终架构

VoicePing 如何基于定制化 Whisper V2 模型,在单条 WebSocket 流中实现自动、低延迟的语言切换——双语模式的完整设计历程。

Akira Noda - VoicePing
3 min
说话人分离模型实战对比评估
Speaker Diarization NeMo

说话人分离模型实战对比评估

在 6 个真实场景中对 NeMo MSDD 和 Pyannote 3.1 进行技术对比评估的研究报告。

Ashar Mirza - VoicePing
2 min

免费试用 VoicePing

通过实时语音翻译,体验跨越语言障碍的交流

免费开始