腾讯混元翻译模型Hy-MT2正式开源

描述

腾讯混元于近日正式开源新一代多语言翻译模型Hy-MT2,同步上线"腾讯Hy翻译"小程序。Hy-MT2包含三个尺寸的模型——Hy-MT2-1.8B、Hy-MT2-7B、Hy-MT2-30B-A3B,均支持33种语言互译及5种民族语言/方言互译。相比上一代Hy-MT1.5,新模型在多语言指令遵循、专业领域翻译和真实应用场景翻译中提升显著,部分能力已追平甚至超越大尺寸通用模型。

Hy-MT2家族三款模型定位清晰。Hy-MT2-1.8B主攻端侧轻量部署,借助腾讯自研AngelSlim 1.25-bit极端量化技术,模型体积压缩至仅约440MB,可在苹果、高通、联发科等主流手机芯片上本地离线推理,推理速度较上一代提升1.5倍,翻译效果整体优于微软Translator、豆包翻译等主流商业API。Hy-MT2-7B为均衡之选,在各类翻译任务上达到开源模型领先水平,超越多款同参数量级模型,实测得分已超过国内主要通用大模型。Hy-MT2-30B-A3B定位专业旗舰,首次引入混合专家(MoE)架构,在扩大总参数规模的同时控制每次推理激活参数量,在真实场景测试集中效果已超过Gemini 3.1 Pro,尤其在金融、政治、教育等垂直领域的翻译表现已部分超越主流翻译模型。

相比上一代,Hy-MT2最大的提升体现在指令遵循能力上。模型能够准确理解并执行用户关于术语、风格和输出格式等方面的个性化要求。例如,通过设定"翻译结果简洁精炼,去掉冗余表达,每句不超过15个字",模型可严格遵循指令输出符合要求的译文。腾讯混元自建的IFMTBench测试集也随模型一同开源。

在通用翻译能力评测FLORES-200中,三款模型分别达到行业顶级闭源模型Gemini 3.1 Pro的88.1%、96.9%和98.1%。在涵盖金融、法律、教育等8个领域的DomainMTBench测试集中,模型评分接近或达到Gemini 3.1 Pro水平。

本次Hy-MT2进一步探索极低比特量化方案,除4-bit、8-bit和FP16版本外,还基于混元自研技术提供了1.25-bit和2-bit版本,以适配不同硬件环境下的部署需求。其中基于混元自研Sherry框架实现的1.25-bit版本已被NLP顶级学术会议ACL 2026录用,在苹果A15上的推理速度相比Hy-MT1.5的4-bit量化版本提升了1.5倍。

模型已在GitHub、Hugging Face、ModelScope等主流开源平台全面开放,兼容ARM、高通、Intel、沐曦、天数智芯等多个硬件平台。沐曦股份曦云C系列GPU已率先完成三款模型的Day 0深度适配。

基于Hy-MT2打造的"腾讯Hy翻译"小程序已同步开放体验,支持语音输入和自定义翻译风格。用户既可在联网环境下使用高速版混元翻译模型,也可提前下载端侧模型,在无网络或弱网络场景中使用离线翻译。iOS和安卓App即将推出。

此外,腾讯混元正与WMT26官方合作,使用Hy-MT系列模型参与"通用机器翻译比赛"和"视频字幕翻译比赛",参赛者有机会获得混元特设奖励。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分