
Speech Translation
On-Device AI
오프라인 음성 번역 앱: iOS/Android 크로스 플랫폼 온디바이스 전사, 번역, TTS
완전 오프라인으로 동작하는 오픈소스 크로스 플랫폼 모바일 음성 번역 앱. 온디바이스 ASR(SenseVoice), 뉴럴 기계번역, TTS를 iOS/Android에서 시스템 오디오 캡처와 함께 구현
Akinori Nakajima - VoicePing
4 min
20개의 글

완전 오프라인으로 동작하는 오픈소스 크로스 플랫폼 모바일 음성 번역 앱. 온디바이스 ASR(SenseVoice), 뉴럴 기계번역, TTS를 iOS/Android에서 시스템 오디오 캡처와 함께 구현

영일 양방향 음성 번역 모델 벤치마크. Qwen3-ASR(1.7B, 최고 품질)과 Distilled Whisper(756M, 4배 빠름)를 OpenAI Whisper large-v3 및 Meta SeamlessM4T v2와 비교 평가합니다.

Kokoro, Piper, Matcha, Kitten, VITS를 포함한 Android/iOS용 18개 온디바이스 TTS 모델 종합 벤치마크

Android, iOS, macOS, Windows에서 16개 온디바이스 음성인식 모델과 9개 추론 엔진에 대한 종합 벤치마크

VoicePing이 커스터마이징한 Whisper V2 모델을 활용하여 단일 WebSocket 스트림 내에서 자동·저지연 언어 전환을 구현한 바이링구얼 모드의 설계 과정을 소개합니다.

NeMo MSDD와 Pyannote 3.1을 6개의 실제 운영 시나리오에서 비교 평가한 기술 보고서입니다.