5月21日,腾讯混元正式开源全新翻译模型Hy-MT2,同时上线基于该模型的翻译小程序「腾讯Hy翻译」。Hy-MT2是一个支持33种语言互译的多语言模型家族,提供Hy-MT2-1.8B、Hy-MT2-7B和Hy-MT2-30B-A3B三个尺寸,分别面向端侧轻量部署、均衡性能和专业翻译场景。
全尺寸覆盖端侧到专业场景
在性能方面,Hy-MT2-7B和Hy-MT2-30B-A3B在各类翻译任务上达到了开源模型的最佳效果,超越了几十倍参数量的模型。轻量级Hy-MT2-1.8B也超越了微软等主流商业翻译API,并且得益于混元自研AngelSlim 1.25-bit极端量化,仅需440MB存储空间,可部署在主流手机芯片上支持本地推理,推理速度相比Hy-MT1.5提升1.5倍。
在通用翻译能力评测FLORES-200上,Hy-MT2系列三个模型已接近目前行业表现最好的Gemini 3.1 Pro。其中,Hy-MT2-7B和Hy-MT2-30B-A3B的实测得分超过国内主要通用大模型;在轻量级模型横向对比中,Hy-MT2-1.8B整体优于头部商业翻译API。在真实场景测试集上,Hy-MT2-30B-A3B效果已超过Gemini 3.1 Pro,尤其在金融、政治、教育等垂直领域表现突出。
指令遵循能力与部署优化
相比上一版本,Hy-MT2的最大提升体现在指令遵循能力上。模型能更准确地理解并执行用户关于术语、风格和输出格式等具体要求。腾讯混元自建数据集IFMT Bench测试结果表明,Hy-MT2-7B和Hy-MT2-30B-A3B的翻译效果已超越同等尺寸开源模型,接近Gemini 3.1 Pro。例如,通过设定“翻译结果简洁精炼,去掉冗余表达,每句不超过15个字”,模型可以很好地遵循该指令。
在量化部署方面,Hy-MT2除提供4-bit、8-bit和FP16版本外,还基于混元自研Sherry框架提供了1.25-bit和2-bit版本,以适配不同硬件环境。1.25-bit极低比特量化版本在苹果A15上的推理速度相比Hy-MT1.5的4-bit版本提升了1.5倍。目前,开源模型已在GitHub、HuggingFace和ModelScope等社区上线,支持ARM、高通、Intel、沐曦、天数智芯等多个平台部署。
「腾讯Hy翻译」小程序基于Hy-MT2打造,相比其他翻译工具,不仅支持语音输入,还优化了自定义翻译风格和指令的能力。用户可在联网环境下使用高速版模型,也可通过提前下载端侧模型在无网络或弱网络场景中离线翻译,解决网络受限问题。
腾讯混元表示,目前正与WMT26官方合作「视频字幕翻译比赛」和「通用机器翻译比赛」,使用Hy-MT系列模型参与有机会获得混元特设奖励,诚邀社区推动翻译技术发展。
本文参考来源:量子位
