产品动态 2025-11-08 1阅读

有道翻译推出「多模态翻译」功能:支持图片 + 语音混合输入,实时生成双语字幕

在跨语言沟通场景中,单一输入方式往往难以应对复杂需求 —— 旅游时既需要翻译路牌图片,又要实时对话;会议中既要解读 PPT 上的外文图表,又要同步翻译发言内容。针对这一痛点,网易有道翻译正式推出「多模态翻译」功能,实现图片与语音输入的无缝切换,支持实时生成双语字幕,让跨语言交流从 "分段处理" 迈向

作者: 有道翻译团队


在跨语言沟通场景中,单一输入方式往往难以应对复杂需求 —— 旅游时既需要翻译路牌图片,又要实时对话;会议中既要解读 PPT 上的外文图表,又要同步翻译发言内容。针对这一痛点,网易有道翻译正式推出「多模态翻译」功能,实现图片与语音输入的无缝切换,支持实时生成双语字幕,让跨语言交流从 "分段处理" 迈向 "场景化融合"。

打破输入边界:图片与语音的协同翻译

传统翻译工具的输入方式往往相互割裂,用户需要在 "拍照翻译" 和 "语音翻译" 功能间反复切换。有道翻译的「多模态翻译」通过智能场景识别,实现了两种输入方式的协同运作:

  • 混合输入实时响应:在对话场景中,用户可一边展示外文图片(如菜单、说明书),一边口述问题,系统会同时识别图片内容与语音信息,生成整合后的翻译结果。例如在餐厅点餐时,拍照识别菜单图片后,口述 "推荐两道招牌菜",系统会结合图片内容翻译为当地语言并附加菜品推荐请求。

  • 上下文关联理解:系统会记忆短时间内的图片与语音交互历史,避免重复翻译。比如先拍照翻译某景点介绍牌,随后询问 "如何前往这里",系统会自动关联图片中的地点名称,确保翻译连贯性。

  • 多语言混合场景适配:面对多方语言环境(如中英日韩混杂的国际会议),系统能自动识别不同发言者的语言,结合 PPT 图片内容,生成统一的双语字幕,解决 "听不清、记不全、译不准" 的问题。

实时双语字幕:从 "听懂" 到 "看清" 的体验升级

「多模态翻译」的核心亮点在于实时生成双语字幕功能,特别适用于线下交流与线上会议场景:

  • 离线场景全覆盖:在无网络环境下(如境外偏远地区),开启离线包后,仍能支持中英日韩等 8 种主流语言的实时字幕生成,延迟控制在 1.5 秒以内,准确率保持在 90% 以上。

  • 字幕样式自定义:用户可根据场景需求调整字幕大小、颜色与位置,支持悬浮窗模式,在视频会议软件(如 Zoom、腾讯会议)中叠加显示,不遮挡核心内容。

  • 专业场景优化:针对教育直播、商务谈判等场景,新增 "术语锁定" 功能,提前导入专业词汇表后,系统会优先匹配术语库译法,确保 "区块链"" 人工智能 " 等专业词汇翻译统一。

某国际学校老师反馈:"以前线上双语课堂需要频繁切换翻译工具,学生经常错过关键内容。现在用有道翻译的实时字幕,课件图片里的英文公式和我的中文讲解能同步翻译成双语字幕,课堂效率提升了不少。"

技术支撑:从 "单一识别" 到 "多模态融合"

「多模态翻译」的实现,依托于有道翻译在 AI 技术上的积累:

  • 跨模态注意力机制:通过深度学习模型,建立图片视觉特征与语音语义特征的关联,让系统理解 "图片中的文字" 与 "口述的问题" 之间的逻辑关系。

  • 轻量化模型优化:将识别模型压缩至原有体积的 40%,在手机端实现高效运行,避免因功能复杂导致的卡顿问题。

  • 场景化训练数据:基于 10 万 + 真实场景语料(涵盖旅游、商务、教育等)训练模型,使系统更熟悉不同场景下的语言习惯与表达逻辑。

如何使用?适用场景有哪些?

目前,「多模态翻译」功能已在有道翻译 APP(8.1.0 及以上版本)上线,用户点击首页 "多模态" 按钮即可进入功能界面。核心适用场景包括:

  • 境外自由行:拍照翻译路牌、菜单,同时与当地人实时对话,字幕同步显示双方语言。

  • 国际会议:实时翻译发言内容,同步识别 PPT 图片中的外文信息,生成会议双语记录。

  • 跨境直播:主播展示外文产品包装的同时讲解功能,系统生成双语字幕,方便不同语言观众理解。

  • 线下培训:外教讲课结合英文课件时,实时生成双语字幕,降低学员理解门槛。

从单一输入到多模态融合,有道翻译的这一功能升级,不仅是技术层面的突破,更重新定义了翻译工具的场景适配能力 —— 当翻译工具能像 "真人助理" 一样理解复杂场景中的信息需求,跨语言沟通才能真正实现 "无障碍"。


相关文章推荐

2025-11-09

术语一致性 98%+:有道 AI 翻译破解欧盟法律条文翻译终极难题

在法律翻译的“无人区”——欧盟法律条文翻译领域,“术语一致性”始终是横亘在全球翻译从业者与AI技术之间的终极障碍。一句“shall”在不同条款中若译为“应当”“必须”或“可”,可能引发截然不同的法律后果;同一“跨境数据流动”概念在24种欧盟官方语言中若出现释义偏差,将直接导致法律文件失效。而近日,网易有道AI翻...

2025-11-08

有道翻译升级「AI 校对」系统:不仅翻译更精准,还能优化原文表达逻辑与语法

“给海外客户发的产品介绍,原文‘我们的设备很厉害,能省很多钱’不仅口语化,翻译后更显得不专业;提交的英文报告里,‘The machine have high efficiency’这样的语法错误自己没发现,却被合作方指出——这些场景让不少职场人陷入尴尬。”针对翻译与原文表达的双重痛点,网易有道翻译正式升级「AI校对」系统,在保障译文...

2025-11-08

网易有道翻译推出「翻译记忆库」功能,企业用户可自定义术语库实现专属翻译风格

“同一份产品手册,市场部译为‘智能终端’,技术部译为‘智能设备’,外贸部却写成‘智能装置’——这种术语混乱不仅降低内部协作效率,更会让海外客户对品牌专业性产生质疑。”这是众多跨国企业在翻译工作中面临的共性难题。为解决企业翻译的“标准化”与“个性化”双重需求,网易有道翻译正式推出「翻译记忆库」功能,支...