
Speech Translation
On-Device AI
오프라인 음성 번역 앱: iOS/Android 크로스 플랫폼 온디바이스 전사, 번역, TTS
완전 오프라인으로 동작하는 오픈소스 크로스 플랫폼 모바일 음성 번역 앱. 온디바이스 ASR(SenseVoice), 뉴럴 기계번역, TTS를 iOS/Android에서 시스템 오디오 캡처와 함께 구현
Akinori Nakajima - VoicePing
4 min
VoicePing의 인사이트와 팁을 전해드립니다
1 / 11

완전 오프라인으로 동작하는 오픈소스 크로스 플랫폼 모바일 음성 번역 앱. 온디바이스 ASR(SenseVoice), 뉴럴 기계번역, TTS를 iOS/Android에서 시스템 오디오 캡처와 함께 구현

영일 양방향 음성 번역 모델 벤치마크. Qwen3-ASR(1.7B, 최고 품질)과 Distilled Whisper(756M, 4배 빠름)를 OpenAI Whisper large-v3 및 Meta SeamlessM4T v2와 비교 평가합니다.

Kokoro, Piper, Matcha, Kitten, VITS를 포함한 Android/iOS용 18개 온디바이스 TTS 모델 종합 벤치마크

Android, iOS, macOS, Windows에서 16개 온디바이스 음성인식 모델과 9개 추론 엔진에 대한 종합 벤치마크

Mint and Print International Conference는 전 세계 중앙은행이 한자리에 모여 지폐 인쇄 및 주화 주조에 있어서 최신 보안 기술과 혁신에 대해 논의하는 2년에 한 번 개최되는 국제 회의입니다. 2025년 회의에는 50개 이상의 중앙은행에서 약 200명이 참가했으며, 30개 기업 및 단체가 후원사 및 연사로 참여했습니다.

VoicePing이 커스터마이징한 Whisper V2 모델을 활용하여 단일 WebSocket 스트림 내에서 자동·저지연 언어 전환을 구현한 바이링구얼 모드의 설계 과정을 소개합니다.