新闻资讯-歌剧话剧

谷歌申请使用自回归生成神经网络来生成音频专利,生成音频信号的预测

金融界2024年11月4日消息,国家知识产权局信息显示,谷歌有限责任公司申请一项名为“使用自回归生成神经网络来生成音频”的专利,公开号CN 118887971 A,申请日期为2023年9月。

专利摘要显示,本申请涉及使用自回归生成神经网络来生成音频。用于生成音频信号的预测的方法、系统和设备,包括编码在计算机存储介质上的计算机程序。方法中的一种方法包括:接收生成音频信号的请求;获得音频信号的语义表示;使用一个或多个生成神经网络以至 少语义表示为条件来生成音频信号的声学表示;以及使用解码器神经网络来处理至少声学表示以生成音频信号的预测。

标签: 音频 神经网络 音频信号