咪咕申请数字人口播视频生成专利,降低口播视频对人物身份的敏感度
更新时间:2024-11-15 14:41 浏览量:7
金融界2024年11月15日消息,国家知识产权局信息显示,咪咕音乐有限公司、咪咕文化科技有限公司、中国移动通信集团有限公司申请一项名为“数字人口播视频生成方法、装置、设备、存储介质和程序产品”的专利,公开号CN 118945420 A,申请日期为2024年8月。
专利摘要显示,本公开涉及人工智能技术领域,尤其是提供一种数字人口播视频生成方法、装置、设备、存储介质和程序产品,一种数字人口播视频生成方法,包括获取口播音频以及口播源视频;利用音生表情模型,生成口播音频中各个音频帧的人脸表情系数;利用表情生面部模型,基于口播音频中各个音频帧的人脸表情系数,修改口播源视频中相应各个视频帧的人脸图像的口型,以生成各个人脸图像对应的口播图像,并根据各个口播图像生成口播视频。实施本公开的技术方案,可以降低口播视频对人物身份的敏感度,使得合成的口播视频的口型内容与实际说话口型一致性更高。