新闻资讯-歌剧话剧

谷歌申请使用词元级损失来增强对序列转导模型的训练专利,训练序列转导模型以基于针对多个训练样本确定的词元级损失来最小化加性错误率

发布时间:2025-06-17 10:50:32  浏览量:17

金融界2025年6月17日消息,国家知识产权局信息显示,谷歌有限责任公司申请一项名为“使用词元级损失来增强对序列转导模型的训练”的专利,公开号CN120167072A,申请日期为2022年11月。

专利摘要显示,一种方法(500)包括针对多个训练样本中的每个训练样本(410):使用序列转导模型(200)来处理对应的训练输入特征(415)以获得一个或多个输出词元序列假设(432),该一个或多个输出词元序列假设各自包括一个或多个所预测的通用词元(204);以及针对每个假设,基于以下来确定词元级损失(462):特殊词元插入的数量,该特殊词元插入各自与对应的所预测的特殊词元相关联,该对应的所预测的特殊词元出现在假设中但未出现在对应的真实值输出词元序列中;以及特殊词元删除的数量,该特殊词元删除各自与一组真实值特殊词元中的未出现在假设中的对应的真实值特殊词元相关联。该方法还包括训练序列转导模型以基于针对多个训练样本确定的词元级损失来最小化加性错误率。

标签: 训练 模型 谷歌 元级 序列
sitemap