据 Yandex 新闻服务报道,大型语言模型 YandexGPT 准备了训练 Yandex Translator 神经网络的文本参考示例。
这使得该服务能够更准确地理解上下文、识别短语单元并导航专业词汇。它可以更好地处理长而复杂的文本,并且更擅长识别句子内部和句子之间的关系。
主题狭窄的文章翻译质量也有所提高:
例如,该服务现在将从上下文中理解我们正在谈论编程语言或股票指数,并且将保留它们的名字而不进行翻译。
更新后的技术用于在 Yandex 翻译器、搜索中将英语文本翻译成俄语,以及在浏览器中翻译视频。
Yandex 自 2018 年以来一直在使用基于神经网络的机器翻译技术。翻译器中的神经网络仅针对文本对进行训练 - 原文及其翻译成另一种语言。
所以她学会了观察他们之间的关系并模仿他们。
该服务中运行的神经网络是轻量级的:这使得它能够实时处理大量的用户请求。
大型 YandexGPT 语言模型能够生成复杂的、词汇和风格多样的文本,包括具有特定术语的文本。因此,该公司利用其潜力创建参考示例来扩展数据集并提高其质量。所以 Translator 中的神经网络并没有失去速度,而是变得更加聪明。