近日消息,阿里国际的AI研发部门AIDC-AI宣布,其倾力打造的多语言翻译巨擘“Marco”已正式投入使用。这一创新成果标志着阿里国际在语言科技领域取得重大突破,Marco翻译系统现全面覆盖中文、英语、日语、韩语、西班牙语、法语等全球15个关键语种,为国际交流搭建了更加广泛与精准的桥梁。
官方称其基于目前广泛使用的开源评测数据集 Flores,Marco 翻译大模型在 BLEU 自动评测指标上,领先于市面上的标杆翻译产品,如 Google 翻译、DeepL、GPT-4 等。
“你的宝贝正在路上”,不会再被翻译成“Your baby is on the way”。以“尊嘟喜欢”这一网络用语为例,一些 AI 翻译产品会将这句话翻译为“Zundu likes it”, 而在 Marco 大模型中,这句话非常地道地翻译为“I really like it”。
从官方获悉,Marco 翻译大模型通过面向多语言的数据筛选技术,如多语种混合语料甄别、多维度数据质量评估,获得高质量、大规模的多语言数据,再结合多语言的混合专家、参数扩张方法,从而保证主导语言(如中、英)性能不下降的情况下,提升其他语种的质量。
对于个人用户来说,Marco 能够根据上下文提供高质量的翻译和良好的可读性,甚至支持不同的翻译风格,满足多样化的翻译需求。
文明上网,理性发言,共同做网络文明传播者