《银行科技研究社》消息:9月16日,平安银行一项名为“语音切分方法、装置、服务器及存储介质”的发明专利授权公告。其申请于2022年6月23日,涉及人工智能技术领域。
其方法包括,获取语音数据,以及确定语音数据中是否包括多种语音频率;若语音数据中包括多种语音频率,则根据预设频率集和语音数据中的各部分的语音频率,对语音数据进行语音分离,得到多个目标语音数据(其中,预设频率集中的每个预设频率对应一个目标用户,一个目标语音数据来自一个目标用户);根据目标语音数据中的语音停顿信息和目标语音数据对应的目标语音文本,确定目标语音数据的目标语音切分点,以及根据目标语音切分点对目标语音数据进行语音切分。
在权利要求书中,也对“根据目标语音数据中的语音停顿信息和目标语音数据对应的目标语音文本,确定目标语音数据的目标语音切分点”等步骤进行了分解,进行了更为详细地阐述。
说明书中提到,该发明的背景为,在语音处理领域中,对语音进行切分是一个比较关键的问题,因为较长的语音在语音识别转换过程中会对系统资源产生较大的消耗,且识别准确率不高。在对语音进行切分处理后,能够减少语音识别的计算量并提高语音识别的准确率。
但相关技术中,通常是采用人工方式对语音进行手动切分,导致语音切分效率不高。
而在该发明中,能够从语音数据中分离出目标用户的语音数据部分,以得到目标语音数据,然后,基于目标语音数据的语音停顿信息及目标语音数据对应的目标语音文本,确定目标语音数据的目标语音切分点,从而采用目标语音切分点对目标语音数据进行切分,可以实现自动针对目标用户的语音数据进行语音切分,有助于提高语音切分的效率和准确率。
更新时间:2025-10-10
本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828
© CopyRight 2020-=date("Y",time());?> All Rights Reserved. Powered By bs178.com 闽ICP备11008920号
闽公网安备35020302034844号