脸萌申请实现自动音乐音频转录专利,有助于实现自动音乐音频转录
更新时间:2024-12-05 12:31 浏览量:7
金融界2024年12月5日消息,国家知识产权局信息显示,脸萌有限公司申请一项名为“ 实现自动音乐音频转录 ”的专利,公开号CN 119068849 A,申请日期为2024年5月。
专利摘要显示,本公开描述了用于实现自动音乐音频转录的技术。深度神经网络模型可以被配置。深度神经网络模型包括频谱交叉注意力子模型,频谱交叉注意力子模型被配置为将每个时间步长t的频谱表示(被表示为St)投影到时间步长t处的潜在数组(被表示为θth)集中,h表示第h次迭代。深度神经网络模型包括被配置为对潜在数组θth集执行自注意力的多个潜在变换器深度神经网络模型还包括时间变换器集时间变换器集被配置为使得能够在不同的时间步长处,在任何潜在数组θth对之间进行通信。训练数据可以通过将多个类型的数据集随机混合来增强,多个类型的数据集包括人声数据集和乐器数据集。深度神经网络模型可以使用经增强的训练数据来训练。