
Speech Translation
On-Device AI
オフライン音声翻訳アプリ:iOS/Androidクロスプラットフォーム対応のオンデバイス文字起こし・翻訳・TTS
完全オフラインで動作するオープンソースのクロスプラットフォームモバイル音声翻訳アプリ。オンデバイスASR(SenseVoice)、ニューラル機械翻訳、TTSをiOS/Androidで実現
Akinori Nakajima - VoicePing
2 min
20件の記事

完全オフラインで動作するオープンソースのクロスプラットフォームモバイル音声翻訳アプリ。オンデバイスASR(SenseVoice)、ニューラル機械翻訳、TTSをiOS/Androidで実現

英日双方向音声翻訳モデルのベンチマーク比較。Qwen3-ASR(1.7Bパラメータ、最高品質)とDistilled Whisper(756M、4倍高速)をOpenAI Whisper large-v3およびMeta SeamlessM4T v2と比較評価。

Kokoro、Piper、Matcha、Kitten、VITSを含むAndroid/iOS向け18のオンデバイスTTSモデルの総合ベンチマーク

Android、iOS、macOS、Windowsにおける16のオンデバイス音声認識モデルと9つの推論エンジンの総合ベンチマーク

VoicePingがカスタマイズしたWhisper V2モデルを活用し、単一WebSocketストリーム内で自動・低遅延の言語切替を実現するバイリンガルモードをどのように設計したか。

NeMo MSDDとPyannote 3.1を6つの実運用シナリオで比較評価した技術レポートです。