Windows 11 上的 Microsoft Edge 141.0.3537.13(测试版)加入了一个基于本地 AI 的语音翻译功能,只需要 4 核心 CPU 以及 12GB 内存,即可将播放中的视频的音频,翻译成你喜欢的语言。对,就是你想的那样。@Appinn

来自 windowslatest 的测试称,目前仅支持少数输入语言(西班牙语、韩语、英语),语言选择非常有限,不能翻译成任意“你喜欢的语言”。
是不是有点失望?
实际上微软发布过一个名为 Real-time video translation(实时视频翻译)的页面,上面详细描述了具体支持的语言:
- 西班牙语和韩语的音频来源可以翻译成英语
- 英语音频可以翻译成西班牙语,印地语和俄语。
- 计划将来支持其他语言。
以及少量支持的站点:
- YouTube
- Reuters
- CNBC News
- Bloomberg
- Money Control
- Coursera
需要在设置中开启标题为“在支持的网站上提供视频翻译“(Offer to translate videos on supported sites)的功能。
用户开启功能后,需要下载 AI 模型,音轨基本无明显延迟。不过,一些情况下,AI 会误把同一个人的不同说话语气,识别为不同性别的声音进行配音,导致同一段对话中出现男女声音频繁切换,影响听觉体验。

虽然现在就能用了,但还是再等等吧,未来是美好的。
原文:https://www.appinn.com/edge-real-time-video-translation/