
Cách UNLEASH Capital Partners dùng dịch AI theo thời gian thực của VoicePing cho sự kiện nhà đầu tư Nhật Bản tại Ấn Độ.
VoicePing · Customer Story · UNLEASH2026
Khi một quỹ đầu tư mạo hiểm Nhật Bản đưa các nhà đầu tư đến Ấn Độ cho một hội nghị kéo dài nhiều ngày, căn phòng tự nhiên trở thành môi trường song ngữ: chương trình diễn ra tại Ấn Độ, còn phần lớn khán giả là người Nhật. UNLEASH Capital Partners đã gặp đúng tình huống đó tại UNLEASH Insights 2026 và lần đầu tiên sử dụng dịch AI theo thời gian thực của VoicePing cho hai ngày thảo luận panel, thuyết trình và Q&A.
Chúng tôi đã trao đổi với Sowmya Arunkumar từ UNLEASH Capital Partners để hiểu vì sao đội ngũ chọn VoicePing, cách công cụ được sử dụng tại hiện trường, điều gì hoạt động tốt và, một cách thẳng thắn, điều gì vẫn cần cải thiện. Chúng tôi giữ phản hồi của cô ấy trực tiếp nhất có thể, vì danh sách mong muốn đó cũng chính là lộ trình sản phẩm mà chúng tôi đang hướng tới.
Sự kiện và rào cản ngôn ngữ
— Bạn có thể giới thiệu về mình và cho biết UNLEASH Insights 2026 là sự kiện như thế nào không?
Sowmya: Tôi làm việc tại UNLEASH với vai trò Consultant, phụ trách xây dựng và báo cáo Impact Thesis, đồng thời quản lý danh mục đầu tư. Tôi gia nhập vào tháng 12 năm 2025. Tôi liên hệ với VoicePing cho một trong những sự kiện chúng tôi lên lịch vào tháng 5, khi khoảng 30 đến 40 đại biểu Nhật Bản đến Ấn Độ. Sự kiện nói về những gì chúng tôi đang làm tại Ấn Độ, các khoản đầu tư mà chúng tôi thực hiện, cũng như các cuộc thảo luận về công ty trong danh mục đầu tư. Chúng tôi thiết kế chương trình gồm thảo luận panel, thuyết trình một-một và Q&A xuyên suốt sự kiện.
— Còn thách thức về ngôn ngữ thì sao?
Sowmya: Phần lớn đại biểu có thể theo dõi bằng tiếng Anh, nhưng họ thoải mái hơn với tiếng Nhật. Vì vậy, chúng tôi muốn họ có thể nắm được điều gì đang diễn ra trong các phiên.
Vì sao chọn VoicePing
— Điều gì khiến bạn chọn VoicePing?
Sowmya: Chúng tôi đã xem xét nhiều công cụ có tại Ấn Độ. Mối lo chính là trong thảo luận panel, các công cụ thường không nhận đúng giọng nói và cách diễn đạt của từng diễn giả, nên bản dịch không ra đúng. Đó cũng là điểm chính chúng tôi thấy trong các đánh giá. Có các giải pháp dùng headset hoặc earbud, nhưng phát thiết bị cho 35 đến 40 người không hợp lý với chúng tôi, nên chúng tôi cần một phần mềm phù hợp với yêu cầu của mình.
— Còn các lựa chọn khác thì sao?
Sowmya: Mô hình thương mại của các công cụ đó không phù hợp. Chi phí cho một sự kiện một ngày khá cao, và phần lớn là theo dạng thuê bao như gói 50 giờ hoặc 100 giờ. Với một sự kiện dùng một lần, điều đó không có ý nghĩa. Đây là sự kiện hằng năm; chúng tôi cần dịch vào thời điểm đó, không phải sử dụng hằng ngày.
— Vậy bạn biết đến chúng tôi bằng cách nào?
Sowmya: Qua một lời giới thiệu. Ông Natsuki Sugai, Managing Partner của chúng tôi, nghe về VoicePing từ một người bạn từng dùng ở Nhật Bản. Người bạn đó nói VoicePing đã cải thiện rất nhiều trong hai năm qua và chúng tôi nên thử xem. Sau đó tôi liên hệ với đội ngũ.
Cách sử dụng tại hiện trường
— Tại sự kiện, bản dịch được chạy trực tiếp trên màn hình trong phòng, bên cạnh màn hình chính, trong cả hai ngày hội nghị. Đội ngũ có hỗ trợ tốt trong quá trình thiết lập không?
Sowmya: Có, đội ngũ đã hỗ trợ xuyên suốt. Họ giúp tải phần mềm và chạy một vài buổi thử trong phòng cùng đội AV của địa điểm. Trong ngày diễn ra sự kiện, Aaron cũng ở cùng chúng tôi cả ngày để hỗ trợ.

— Giá có dễ làm việc với nhu cầu của bạn không?
Sowmya: Có. Trong cuộc gọi đầu tiên, đội ngũ giải thích các gói cho sự kiện một ngày hoặc hai ngày, điều đó rất hữu ích. Chúng tôi cũng xem demo trong cuộc gọi đó, và điều này giúp chúng tôi có niềm tin rằng giải pháp sẽ phù hợp.

Trong ngày sự kiện: Điều hiệu quả và điều chưa hiệu quả
— Chất lượng dịch như thế nào?
Sowmya: Dịch từ tiếng Anh sang tiếng Nhật thì ổn. Nhưng có một phiên có người nói tiếng Nhật và cần dịch sang tiếng Anh, phần đó thật sự chưa đạt yêu cầu. Tôi không nói tiếng Nhật, nên tôi hoàn toàn dựa vào nội dung được dịch, và có những lúc nội dung hiện ra không đúng.
— Cách hiển thị trên màn hình thì sao?
Sowmya: Một khi một cụm đã được dịch, nó không nên bị viết lại nhiều lần. Tôi đọc một câu và hiểu nó, nhưng khi chuyển sang câu tiếp theo thì dòng trước đó đã thay đổi, khiến ý nghĩa bị mất. Điều đó gây khó hiểu và diễn ra quá nhanh để theo kịp.
— Nhận xét đó rất hợp lý. Tiếng Nhật và tiếng Anh có trật tự từ gần như đối lập, nên ý nghĩa của một câu tiếng Nhật thường chỉ rõ ràng khi động từ xuất hiện ở cuối câu. Vì vậy, bản dịch tiếng Anh ban đầu có thể bị chỉnh lại giữa câu. Đây là giới hạn mà chúng tôi đang xử lý: một mô hình mới với ít hiện tượng nhấp nháy hơn đang được phát triển. Trong cuộc gọi, chúng tôi cũng giới thiệu chế độ chia màn hình, giữ các dòng đã ổn định ở bên cạnh phần văn bản trực tiếp.
— Khán giả nhìn chung phản hồi thế nào?
Sowmya: Tốt hơn nhiều so với việc không có gì. Người tham dự thoải mái hơn với tiếng Nhật, và bản dịch giúp họ theo dõi những gì đang diễn ra.

Điều chỉnh từ điển giữa ngày thứ nhất và ngày thứ hai
Một ghi chú vận hành từ phía chúng tôi: không phải toàn bộ thuật ngữ của sự kiện đều được đưa vào từ điển kịp cho ngày đầu tiên. Vì vậy, đội ngũ VoicePing đã bổ sung thêm thuật ngữ cho ngày thứ hai, và khả năng nhận diện những thuật ngữ đó đã được cải thiện. Đây là một minh chứng thực tế cho yêu cầu về bảng thuật ngữ trước sự kiện mà Sowmya đề cập: các thuật ngữ quan trọng nên được chuẩn bị trước phiên đầu tiên, thay vì phải bổ sung sau khi sự kiện đã bắt đầu.

Không chỉ dịch: Ghi hình và tóm tắt
Ngoài dịch trực tiếp, cuộc gọi cũng đề cập đến tính năng ghi hình và tóm tắt của VoicePing. Mỗi phiên đều được tự động ghi lại và tóm tắt, với toàn bộ bản chép lời có thể tải xuống dưới dạng PDF, tệp văn bản hoặc âm thanh. Trong cuộc gọi, Sowmya đăng nhập vào workspace, mở bản ghi của phiên kéo dài sáu giờ, và chúng tôi cùng xem cách chia sẻ nội dung đó với đồng nghiệp sau sự kiện.
Về chi phí
— Chi phí có phù hợp với bạn không?
Sowmya: Với chúng tôi, đây là nhu cầu dùng một lần, và là sự kiện hằng năm. Vì vậy, thuê bao hay gói 50 giờ, 100 giờ đều không hợp lý. Gói theo sự kiện là lựa chọn phù hợp.
Để xem giá gói sự kiện hiện tại, vui lòng xem bảng giá ứng dụng dịch sự kiện của VoicePing.
Điều họ muốn thấy tiếp theo
— Điều gì sẽ giúp sự kiện tiếp theo tốt hơn?
Sowmya: Có một vài điểm. Thứ nhất là bảng thuật ngữ được tải sẵn. Những từ như UNLEASH và tên các công ty trong danh mục đầu tư xuất hiện thường xuyên và không cần dịch, nên sẽ rất hữu ích nếu có thể đặt chúng trong từ điển từ trước. Với tư cách là khách hàng không quá thành thạo phần mềm, sẽ rất tốt nếu các bạn có thể đưa cho chúng tôi danh sách từ cần thiết lập trước phiên. Thứ hai, chiều dịch từ tiếng Nhật sang tiếng Anh vẫn có thể cải thiện. Có thể do accent hoặc tốc độ nói của diễn giả, nhưng nó có thể tốt hơn. Và thứ ba, một khi một cụm đã được dịch, nó không nên liên tục bị viết lại.
— Cả ba điểm này đều nằm trong lộ trình của chúng tôi: thiết lập thuật ngữ trước sự kiện có hướng dẫn, dịch Nhật-Anh mạnh hơn, và cách hiển thị ổn định hơn với ít thay đổi giữa câu hơn.
Nhìn về phía trước
— Có kế hoạch nào cho lần tổ chức tiếp theo không?
Sowmya: Trong năm nay, chúng tôi chưa có kế hoạch nào khác. Có thể sẽ có một số kế hoạch vào tháng 12, và nếu chúng tôi tổ chức một summit khác, chúng tôi sẽ xem xét khi đó.
— Vì vậy, chúng tôi xem đây là một danh sách mong muốn hơn là một cam kết gia hạn. Một phiên bản mới của ứng dụng, với mô hình dịch mới và ít nhấp nháy hơn đáng kể, đang được phát triển. Chúng tôi sẽ tiếp tục cập nhật cho đội ngũ khi phiên bản đó ra mắt. Nếu UNLEASH tổ chức một summit khác, chúng tôi muốn chứng minh rằng VoicePing xứng đáng được chọn lần nữa.
Điểm chính
- Lần triển khai đầu tiên cho hội nghị LP đầu tiên của UNLEASH Capital Partners: dịch Nhật ↔ Anh theo thời gian thực trong hai ngày hội nghị, ngày 19 và 21 tháng 5 năm 2026, hiển thị trực tiếp trên màn hình trong phòng.
- Được chọn thay cho giải pháp headset/earbud, vốn không thực tế với 35–40 người, và thay cho các công cụ thuê bao không phù hợp với một sự kiện diễn ra mỗi năm một lần; VoicePing đến qua một lời giới thiệu cá nhân.
- Kết quả trung thực: dịch Anh→Nhật có thể sử dụng và “tốt hơn là không có gì”; dịch Nhật→Anh cần cải thiện, và việc văn bản trên màn hình thay đổi giữa câu khiến người xem khó theo dõi.
- Đội ngũ VoicePing tại hiện trường đã tinh chỉnh từ điển thuật ngữ giữa ngày thứ nhất và ngày thứ hai, cải thiện khả năng nhận diện các thuật ngữ riêng của sự kiện.
- Ngoài dịch trực tiếp, VoicePing còn ghi lại toàn bộ phiên, tạo tóm tắt AI và bản chép lời, có thể tải xuống dưới dạng PDF, văn bản hoặc âm thanh; phần này đã được hướng dẫn trong cuộc gọi.
- Danh sách mong muốn gồm hỗ trợ bảng thuật ngữ trước sự kiện, dịch Nhật→Anh tốt hơn và hiển thị ổn định hơn. Tất cả đều nằm trong lộ trình của VoicePing.
Hồ sơ công ty: UNLEASH Capital Partners, Inc.
- Công ty: Nhà quản lý quỹ đầu tư mạo hiểm Nhật Bản đầu tư vào các startup fintech và tài chính toàn diện giai đoạn sớm tại Ấn Độ (seed / Series A)
- Quỹ đầu tiên: khoảng 3 tỷ rupee Ấn Độ, đóng quỹ năm 2025; được hỗ trợ bởi khoảng 35 limited partner Nhật Bản
- Founder & Managing Partner: Natsuki Sugai
- Định vị sứ mệnh: “UNLEASH the future of finance. Include everyone.”
- Website chính thức: UNLEASH Capital Partners
Mang dịch thời gian thực đến sự kiện tiếp theo của bạn cùng VoicePing
VoicePing đưa dịch thời gian thực vào panel, thuyết trình và Q&A, giúp khán giả theo dõi chương trình bằng một ngôn ngữ khác.
- Phụ đề trên màn hình trong phòng: bản dịch hiển thị trực tiếp bên cạnh màn hình chính và chuyển đổi theo ngôn ngữ của người nói.
- Không cần thuê bao: gói theo sự kiện được thiết kế cho summit một ngày hoặc nhiều ngày, không phải kế hoạch sử dụng dài hạn.
- Ghi hình và tóm tắt: các phiên sự kiện có thể được lưu lại dưới dạng bản chép lời, tóm tắt AI và âm thanh để xem lại sau sự kiện.
- Hỗ trợ trực tiếp: thiết lập trước sự kiện, thử nghiệm trong phòng với đội AV và hỗ trợ tại hiện trường trong ngày diễn ra.
Tìm hiểu thêm về VoicePing cho sự kiện
Cuộc phỏng vấn được thực hiện ngày 4 tháng 6 năm 2026 với Sowmya Arunkumar từ UNLEASH Capital Partners, Inc. Cuộc phỏng vấn được thực hiện bằng tiếng Anh; câu trả lời đã được biên tập nhẹ về độ dài và độ rõ ràng.


