一种适用于混响环境的麦克风阵列语音增强方法

一种适用于混响环境的麦克风阵列语音增强方法 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 第卷第期信号处理年月一种适用于混响环境的麦克风阵列语音增强方法张丽艳 , , 殷福亮’ 大连理工大学电子与信息工程学院 , 大连大连交通大学电气信息学院 , 大连摘要在小型视频会议系统中 , 影响语音处理系统性能的主要因素是房间混响效应。现有语音增强方法大...

© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 第卷第期信号处理年月一种适用于混响环境的麦克风阵列语音增强方法张丽艳 , , 殷福亮’ 大连理工大学电子与信息工程学院 , 大连大连交通大学电气信息学院 , 大连摘要在小型视频会议系统中 , 影响语音处理系统性能的主要因素是房间混响效应。现有语音增强方法大都采用加性噪声模型 , 没有考虑混响而基于倒谱的语音去混响方法大多计算复杂。为此 , 本文给出了一种改进的麦克风阵列倒谱域语音去混响方法。该方法首先计算含噪语音倒谱域的最小相位分量 , 并对其进行波束形成 , 再进行低通滤波然后利用人耳对相位信息的不敏感性 , 采用含噪语音的相位来合成增强后的语音信号 , 从而有效地降低了运算量。仿真结果表明 , 该方法在混响环境下能有效地改善语音质量。关键词语音增强麦克风阵列混响倒谱中图分类号文献标识码文章编号一一一一 · 一 , 爵 , , , , ‘ 一 , 〕 , 《。引言在实际应用中 , 语音信号常常受到噪声的干扰。环境噪声的存在导致语音处理系统的性能下降 , 严重时使系统无法正常工作。因此 , 近年来语音增强技术已经成为许多语音处理系统的一个重要模块 , 并在视频会议系统川、车载通信、助听器 ’ 、机器人导航〔‘ 等领域得到了广泛应用。基于麦克风阵列的语音增强方法较多 , 大体上可以分为五类传统的波束形成技术 , 也称为固定波束形成技术〔’〕自适应波束形成技术〔具有后置滤波器的波束形成技术〔’别信号子空间方法心〕单麦克与多麦克技术相融合的方法〔’〕。无论哪种语音增强方法 , 其目的都是提高语音质量 , 进行噪声抑制。目前的语音增强方法〔 · 一‘ 大多采用加性噪声的信号模型 , 没有考虑房间混响效应 , 这在以环境噪声为主要干扰源的情况下是合适的。但是在小型视频会议房间中 , 通常室内比较安静 , 噪声较小 , 而客观存在的房间混响则是影响系统性能的主要因素。为了抑制房间混响 , 文〔提出了倒谱域语音去混响方法 ’ , 但该方法计算复杂 , 难以在实际系统中应用。为此 , 本文依据倒谱和最小相位理论 , 给出了一种收稿日期年月日修回日期年月日基金项目国家自然科学基金资助项目和和教育部跨世纪优秀人才基金资助项目 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 第期一种适用于混响环境的麦克风阵列语音增强方法适用于混响环境的麦克风阵列语音增强方法。该方法首先对时延补偿后的含噪语音信号通过傅立叶变换计算其倒谱其次在倒谱域求最小相位分量 , 并对其进行波束形成 , 再进行低通滤波然后利用人耳对相位信息的不敏感性 , 用含噪语音信号的相位来合成增强后的语音 , 以减小计算量。该方法思路简单 , 计算复杂度不高 , 可以在混响环境下有效地实现语音增强。本文第二部分给出了接收信号模型 , 第三部分介绍了房间冲激响应 , 第四部分给出最小相位倒谱理论 , 第五部分说明了本文方法的基本原理与实现步骤 , 第六部分给出了计算机仿真结果 , 最后是本文的结论。一 ‘ , 了一少‘ , 一 , 无 , 」, 。为声速 , 这里、和分别为房间的长、宽和高 , 和 ’分别为声源坐标和麦克风坐标。若各个墙面的反射系数均相等且等于下 , 则式可化简为 , , ‘ 艺至, 一 ’, · ’, ‘一 ’, ’‘ ’, ’爪一‘ ’, ’。占卜 , 二 , 当房间大小为米米米 , 墙面的反射系数二时 , 混响时间约为 , 房间冲激响应曲线如图所示。信号模型假设声音传播满足线性波动方程 , 这时声源和麦幅度克风间的通道可认为是线性系统。若个麦克风线性均匀排列 , 间距为 , 声源人射角度为 , 信号模型如图所示。陌片一川时间图房间冲激响应城二材图信号模型则第 ‘个麦克接收的信号为 ‘ 其中为声源信号 , 、为房间冲激响应 , 为噪声 , ’ ‘为卷积运算符。沪、、,了了汀、 ‘爪八房间冲激响应在小型会议室中 , 由于房间墙壁反射等原因 , 使得语音信号在房间内进行多径传输 , 从而产生混响效应。通常 , 用混响时间来表征房间的混响程度。假设房间内各个墙面的反射系数均相等且为 , 按照州公式 , 混响时间印可以表示为最小相位倒谱理论信号人。的复倒谱人。定义为〔” 人。二入。卜厂 , 田。〕这里符号 ’八 ’表示倒谱 , 表示复倒谱算子 , 是复对数算子 , 一 ’表示傅立叶反变换。通常 , 信号可在倒谱域分解成最小相位信号和全通信号。令。。。表示复倒谱的最小相位分量 , 根据傅立叶变换性质和倒谱定义 , 复倒谱的最小相位分量、。可表示为几一卫兰丝里 , 一一式中和分别表示房间的体积和总面积。通常采用模型〔’“ 〕来模拟房间混响。假设墙面光滑 , 呈镜面反射 , 但每次反射都会损失部分声波能量 , 这种往复的反射现象可以等价为一系列强度衰减的镜像源。若能找到所有镜像源的强度和位置分布 , 便能得到房间冲激响应。模型产生房间冲激响应的计算公式为 “ ‘ , , ‘ , 二么垦二刀夕一 ‘ ’。打’。一 ’。儿’月犷一 ’。 , 人厂 , 人。 , 这里是的实倒谱。利用式 , 就可实现人人 ‘。 , , 的分解。占卜 , , , , 其中夕〔」, 凤是房间各面的反射系数 , ,月 , ,月二 ,月, , ,月, ,月 , 二〕, 本文的倒谱域语音去混响方法本文倒谱域语音去混响方法的原理框图如图所示。该方法首先将接收到的含噪语音信号时延补偿后 , 通过傅立叶变换计算其倒谱 , 并在倒谱域求出其最小相位分量考虑到语音倒谱信号的最小相位分量大都集中在低频部分 , 因此在倒谱域内进行波束形成后 , 再进行低通滤波 , 以滤除混响成分。其次 , 利用人耳对相位的不敏感性 , 仅利用一路麦克风接收的含噪语音 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 第期一种适用于混响环境的麦克风阵列语音增强方法适用于混响环境的麦克风阵列语音增强方法。该方法首先对时延补偿后的含噪语音信号通过傅立叶变换计算其倒谱其次在倒谱域求最小相位分量 , 并对其进行波束形成 , 再进行低通滤波然后利用人耳对相位信息的不敏感性 , 用含噪语音信号的相位来合成增强后的语音 , 以减小计算量。该方法思路简单 , 计算复杂度不高 , 可以在混响环境下有效地实现语音增强。本文第二部分给出了接收信号模型 , 第三部分介绍了房间冲激响应 , 第四部分给出最小相位倒谱理论 , 第五部分说明了本文方法的基本原理与实现步骤 , 第六部分给出了计算机仿真结果 , 最后是本文的结论。一 ‘ , 了一少‘ , 一 , 无 , 」, 。为声速 , 这里、和分别为房间的长、宽和高 , 和 ’分别为声源坐标和麦克风坐标。若各个墙面的反射系数均相等且等于下 , 则式可化简为 , , ‘ 艺至, 一 ’, · ’, ‘一 ’, ’‘ ’, ’爪一‘ ’, ’。占卜 , 二 , 当房间大小为米米米 , 墙面的反射系数二时 , 混响时间约为 , 房间冲激响应曲线如图所示。信号模型假设声音传播满足线性波动方程 , 这时声源和麦幅度克风间的通道可认为是线性系统。若个麦克风线性均匀排列 , 间距为 , 声源人射角度为 , 信号模型如图所示。陌片一川时间图房间冲激响应城二材图信号模型则第 ‘个麦克接收的信号为 ‘ 其中为声源信号 , 、为房间冲激响应 , 为噪声 , ’ ‘为卷积运算符。沪、、,了了汀、 ‘爪八房间冲激响应在小型会议室中 , 由于房间墙壁反射等原因 , 使得语音信号在房间内进行多径传输 , 从而产生混响效应。通常 , 用混响时间来表征房间的混响程度。假设房间内各个墙面的反射系数均相等且为 , 按照州公式 , 混响时间印可以表示为最小相位倒谱理论信号人。的复倒谱人。定义为〔” 人。二入。卜厂 , 田。〕这里符号 ’八 ’表示倒谱 , 表示复倒谱算子 , 是复对数算子 , 一 ’表示傅立叶反变换。通常 , 信号可在倒谱域分解成最小相位信号和全通信号。令。。。表示复倒谱的最小相位分量 , 根据傅立叶变换性质和倒谱定义 , 复倒谱的最小相位分量、。可表示为几一卫兰丝里 , 一一式中和分别表示房间的体积和总面积。通常采用模型〔’“ 〕来模拟房间混响。假设墙面光滑 , 呈镜面反射 , 但每次反射都会损失部分声波能量 , 这种往复的反射现象可以等价为一系列强度衰减的镜像源。若能找到所有镜像源的强度和位置分布 , 便能得到房间冲激响应。模型产生房间冲激响应的计算公式为 “ ‘ , , ‘ , 二么垦二刀夕一 ‘ ’。打’。一 ’。儿’月犷一 ’。 , 人厂 , 人。 , 这里是的实倒谱。利用式 , 就可实现人人 ‘。 , , 的分解。占卜 , , , , 其中夕〔」, 凤是房间各面的反射系数 , ,月 , ,月二 ,月, , ,月, ,月 , 二〕, 本文的倒谱域语音去混响方法本文倒谱域语音去混响方法的原理框图如图所示。该方法首先将接收到的含噪语音信号时延补偿后 , 通过傅立叶变换计算其倒谱 , 并在倒谱域求出其最小相位分量考虑到语音倒谱信号的最小相位分量大都集中在低频部分 , 因此在倒谱域内进行波束形成后 , 再进行低通滤波 , 以滤除混响成分。其次 , 利用人耳对相位的不敏感性 , 仅利用一路麦克风接收的含噪语音 © 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 第期一种适用于混响环境的麦克风阵列语音增强方法结论本文利用人耳对相位的不敏感特性 , 采用了一种近似的手段 , 从含噪的语音信号中提取相位信息 , 从而提供了一种新的麦克风阵列语音去混响方法。与传统的倒谱域语音增强方法相比 , 该方法具有更低的运算量 , 可应用于实际需要考虑混响的视频会议系统中。仿真结果表明了该方法的有效性。参考文献仁 , , 一一一一罗 , , , 加一厂」一 , , , , , 一〔〕 , 助 , , , 一〕 , 一 , ’ , , , , , , 一一一 , , , , , 一 , 邵 , , 一〔」阎兆立 , 杜利民 , 改进的后滤波波束形成器语音增强算法 , 电子与信息学报 , 《巧 , 一【」一 , , , , 一仁〕 , , , · · , , 一」 , 叮一 , , , 一仁川 , , , , , 一」马晓红 , 陆晓燕 , 殷福亮 , 改进的互功率谱相位时延估计方法 , 电子与信息学报 , 《只 , 一作者简介张丽艳 , 女 , 年生 , 博士生 , 讲师。大连理工大学电子与信息工程学院信号与信息处理专业博士生。主要研究方向为数字信号处理 , 麦克风阵列语音处理。殷福亮 , 男 , 年生 , 博士生导师 , 大连理工大学电子与信息工程学院教授。主要研究方向为数字信号处理 , 语音处理 , 图像处理 , 宽带无线通信技术。

                    本文档为【一种适用于混响环境的麦克风阵列语音增强方法】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

一种适用于混响环境的麦克风阵列语音增强方法

你可能还喜欢