虎博科技提升机器翻译效果3倍 加速文化全球化融合

admin 网络动态 2024-02-04 08:43:45 0 翻译 for me 模型

近日,全球领先的智能金融搜索引擎Tobao Technology发布了最新前沿研究成果Levenshtein Transformer,使其在机器翻译领域的相关速度提升了3倍以上,占据了现有机器翻译高地。Tobbo Technology创始人兼首席执行官陈叶表示,机器翻译能力的大幅提升,不仅能提高人类的效率,还能促进计算机科学、数学、语言学、翻译学等领域的快速发展,对解决全球信息不对称问题有很大帮助,加速文化全球化的快速融合。

Levenshtein Transformer基于Transformer模型的优化和升级,是第一个可以自由控制标尺的翻译模型,颠覆了现有的机器翻译流程和方法,以更灵活的顺序创建机器翻译的机制和流程。通过在不同段之间进行添加或删除单词的行为,可以突破现有的限制界限,同步优化整个语言表达方式,提高翻译效果、总结能力和时间效率,在目前最短的时间内实现长文本的高质量翻译记录。Transformer是谷歌在2017年提出的最先进的机器翻译模型,它是开源的,并被全球领先的技术公司使用。Tiger Technology的算法负责人Jake Zhao参与了这项研究,他对不同目标和三种不同语言的公开数据集进行了多项实验。结果不仅翻译速度提高了至少三倍,而且翻译质量也发生了重大变化。一般来说,现有的Transformer模型需要对文本进行至少20次串行解码,在测试集上平均需要300毫秒以上,而Levenshtein Transformer可以通过大幅减少串行部分并并行插入和删除来完成翻译。这样的模型设计不仅将平均翻译时间缩短到100毫秒左右,而且还为模型提供了翻译的动态灵活性。在翻译质量方面,基于Levenshtein Transformer的翻译通常得到更高的评价

以Levenshtein Transformer实验结果“ The too high rotation speed produces the reverse deformation”为例,Levenshtein Transformer模型在三个插入删除周期后获得了高质量的翻译,该模型在世界范围内非常擅长语言转换,支持任何语言的直接翻译和摘要。

Levenshtein Transformer的实验实例Jake Zhao表示,Levenshtein Transformer使用模仿学习来训练插入和删除,使机器能够更快、更自然地在模拟中进行通信。同时,由于插入和删除的互补性,我们利用模型插入后的句子来训练删除方法,利用模型删除后的句子来训练插入,给模型一个自我检查和修改的机会。“例如,传统的自动化模型只能实现长度的增长和停止,但如果模型产生了一个糟糕的词,就没有办法收回这个词。由于Levenshtein Transformer模型允许插入和删除,它可以自主和动态地控制模型的原始生长,并使模型解码更加灵活。Jake Zhao对此作了进一步解释。“就像人类写作文一样,以前的模型不仅支持逐字写,而且还支持写后的修改,但Levenshtein Transformer更聪明,写后自己修改。目前,全球信息和金融数据的机器翻译每天达到数亿次。利用虎博搜索查找海外上市公司的活跃用户,例如输入“活跃用户”进行提问,在一秒钟内在搜索后台进行数百万次计算,经过语言理解“活跃用户”后,识别并提取相应的“PDD”、“活跃买家”的相应内容。点击显示最准确的数据,搜索“特斯拉Model3产能”,系统会自动理解产能的含义,并提取出相应的“Model3产能”内容。在此过程中,我们的核心技术之一-机器翻译--首次完成了公司名称、业务描述和英文财务报告的理解和翻译。据了解,该研究成果将应用于虎博科技的底层架构,全面提升现有机器翻译能力,直接影响虎博搜索、西梅、招股书、富富股份、虎博翻译等产品,打破全球金融信息的语言障碍,为用户提供更加贴心的产品体验。随着未来技术业务领域的拓展,优秀的机器翻译能力将同时应用于更广泛的信息获取领域,加速文化全球化的融合。文化全球化与经济全球化一样,是世界发展的趋势,因为尖端技术的发展使人们之间的交流更加容易,文化间的交流也更加顺畅。陈叶表示,华宝科技将继续致力于前沿技术的探索,以加快产业智能化落地,推动世界经济发展,“我们将不遗余力地开展全球前沿技术交流,为全球文化融合与发展探索更多可能性”。

分享: