本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法,包括S1、对原始语音数据进行信号预处理,并对预处理后的语音数据划分训练集与测试集;S2、对训练集数据和测试集数据进行压缩;S3、对压缩后的训练集数据和测试集数据进行独热编码;S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络;S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库,使数据库能够应用更复杂的机器学习算法。
本发明公开了一种小样本不均衡语音数据库的生成式数据增强方法,包括S1、对原始语音数据进行信号预处理,并对预处理后的语音数据划分训练集与测试集;S2、对训练集数据和测试集数据进行压缩;S3、对压缩后的训练集数据和测试集数据进行独热编码;S4、使用独热编码后的训练集数据训练低残差WaveNet神经网络;S5、使用独热编码后的测试集数据和训练好的低残差WaveNet神经网络生成原始数据库中不存在的语音样本。本发明小样本不均衡语音数据库的生成式数据增强方法及系统可以生成准确、多样的语音样本以扩充现有小样本不均衡语音数据库,使数据库能够应用更复杂的机器学习算法。
商品类型 | 技术成果 | 项目阶段 | 其他 | 成果权属 | 独占 |
技术领域 |
电子信息 计算机产品及其网络应用技术 信息安全技术
电子信息 计算机产品及其网络应用技术 信息安全技术 | 交易方式 | 合作开发 | 权属人 | |