© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 卷 第 期 信 号 处 理
年 月
一种适用于混响环境的麦克风阵列语音增强方法
张丽艳 , , 殷福亮’
大连理工 大学电子与信息工 程学院 , 大连 大连交通大学电气信息学院 , 大连
摘 要 在小型视频会议系统中 , 影响语音处理系统性能的主要因素是房间混响效应 。 现有语音增强方法大都采用加
性噪声模型 , 没有考虑混响 而基于倒谱的语音去混响方法大多计算复杂 。 为此 , 本文给出了一种改进的麦克风阵列倒谱
域语音去混响方法 。 该方法首先计算含噪语音倒谱域的最小相位分量 , 并对其进行波束形成 , 再进行低通滤波 然后利用
人耳对相位信息的不敏感性 , 采用含噪语音的相位来合成增强后的语音信号 , 从而有效地降低了运算量 。 仿真结果
表
关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf
明 ,
该方法在混响环境下能有效地改善语音质量 。
关键词 语音增强 麦克风阵列 混响 倒谱
中图分类号 文献标识码 文章编号 一 一 一
一 · 一
, 爵 , ,
, ,
‘ 一
,
〕
,
《
。
引言
在实际应用 中 , 语音信号常常受到噪声 的干扰 。
环境噪声的存在导致语音处理系统 的性能下降 , 严重
时使系统无法正常工作 。 因此 , 近年来语音增强技术
已经成为许多语音处理系统的一个重要模块 , 并在视
频会议系统川
、
车载通信
、 助听器 ’ 、 机器人导航 〔‘
等领域得到了广泛应用 。
基于麦克风阵列的语音增强方法较多 , 大体上可
以分为五类 传统的波束形成技术 , 也称为固定波
束形成技术〔’〕 自适应波束形成技术〔 具有后
置滤波器的波束形成技术 〔’别 信号子空间方法 心 〕
单麦克与多麦克技术相融合的方法 〔’〕。 无论哪种
语音增强方法 , 其 目的都是提高语音质量 , 进行噪声抑
制 。 目前的语音增强方法 〔
· 一‘ 大多采用加性噪声的信
号模型 , 没有考虑房间混响效应 , 这在以环境噪声为主
要干扰源的情况下是合适的 。 但是在小型视频会议房
间中 , 通常室 内比较安静 , 噪声较小 , 而客观存在 的房
间混响则是影响系统性能的主要因素 。 为了抑制房间
混响 , 文 〔 提出了倒谱域语音去混响方法 ’ , 但该方
法计算复杂 , 难以在实际系统中应用 。
为此 , 本文依据倒谱和最小相位理论 , 给出了一种
收稿 日期 年 月 日 修回日期 年 月 日
基金项 目 国家自然科学基金资助项 目 和 和教育部跨世纪优秀人才基金资助项 目
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 期 一种适用于混响环境的麦克风阵列语音增强方法
适用于混响环境的麦克风阵列语音增强方法 。 该方法
首先对时延补偿后的含噪语音信号通过傅立叶变换计
算其倒谱 其次在倒谱域求最小相位分量 , 并对其进行
波束形成 , 再进行低通滤波 然后利用人耳对相位信息
的不敏感性 , 用含噪语音信号的相位来合成增强后的
语音 , 以减小计算量 。 该方法思路简单 , 计算复杂度不
高 , 可以在混响环境下有效地实现语音增强 。
本文第二部分给出了接收信号模型 , 第三部分介
绍了房间冲激响应 , 第四部分给出最小相位倒谱理论 ,
第五部分说明了本文方法的基本原理与实现步骤 , 第
六部分给出了计算机仿真结果 , 最后是本文的结论 。
一 ‘ , 了一 少‘ , 一 , 无 , 」, 。 为声速 ,
这里 、 和 分别为房间的长 、宽和高 , 和 ’分别为
声源坐标和麦克风坐标 。
若各个墙面的反射系数均相等且等于 下 , 则式
可化简为
, , ‘ 艺 至, 一 ’,
· ’, ‘一 ’, ’‘ ’, ’爪
一‘ ’, ’。
占 卜 ,
二 ,
当房间大小为 米 米 米 , 墙面的反射系数
二 时 , 混响时间约为 , 房间冲激响应曲线
如图 所示 。
信号模型
假设声音传播满足线性波动方程 , 这时声源和麦
幅
度
克风间的通道可认为是线性
系统 。 若 个麦克风线性
均匀排列 , 间距为 , 声源人
射角度为 , 信号模型如图
所示 。
陌片一川时间
图 房间冲激响应
城 二 材
图 信号模型
则第 ‘个麦克接收的信号为
‘
其中 为声源信号 , 、 为房间冲激响应 , 为
噪声 , ’ ‘为卷积运算符 。
沪、
、,了了汀、
‘爪
八
房间冲激响应
在小型会议室中 , 由于房间墙壁反射等原因 , 使得
语音信号在房间内进行多径传输 , 从而产生混响效应 。
通常 , 用混响时间来表征房间的混响程度 。 假设房间
内各个墙面的反射系数均相等且 为 , 按照 州 公
式 , 混响时间 印可以表示为
最小相位倒谱理论
信号 人 。 的复倒谱 人 。 定义为〔”
人 。 二 入 。 卜 厂 , 田 。 〕
这里符号 ’八 ’表示倒谱 , 表示复倒谱算子 , 是复
对数算子 , 一 ’表示傅立叶反变换 。
通常 , 信号可在倒谱域分解成最小相位信号和
全通信号 。 令 。 。 。 表示 复倒谱的
最小相位分量 , 根据傅立 叶变换性质和倒谱定义 ,
复倒谱的最小相位分量 、。 可表示为
几
一卫兰丝 里
, 一 一
式中 和 分别表示房间的体积和总面积 。
通常采用 模型 〔’“ 〕来模拟房间混响 。 假设墙
面光滑 , 呈镜面反射 , 但每次反射都会损失部分声波能
量 , 这种往复的反射现象可 以等价为一系列强度衰减
的镜像源 。 若能找到所有镜像源的强度和位置分布 ,
便能得到房间冲激响应 。 模型产生房间冲激响
应的计算公式为
“ ‘ , , ‘ , 二么垦
二刀夕
一 ‘ ’。打’。 一 ’。儿’月犷一 ’。 ,
人厂 ,
人 。
,
这里 是 的实倒谱 。 利用式 , 就可实现
人 人 ‘。 , , 的分解 。
占 卜 ,
,
,
,
其中夕 〔 」,
凤 是房间各面的反射系数 ,
,月 , ,月二 ,月, , ,月, ,月 ,
二 〕,
本文的倒谱域语音去混响方法
本文倒谱域语音去混响方法的原理框图如图 所
示 。 该方法首先将接收到的含噪语音信号时延补偿
后 , 通过傅立叶变换计算其倒谱 , 并在倒谱域求出其最
小相位分量 考虑到语音倒谱信号的最小相位分量大
都集中在低频部分 , 因此在倒谱域内进行波束形成后 ,
再进行低通滤波 , 以滤除混响成分 。 其次 , 利用人耳对
相位的不敏感性 , 仅利用一路麦克风接收的含噪语音
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 期 一种适用于混响环境的麦克风阵列语音增强方法
适用于混响环境的麦克风阵列语音增强方法 。 该方法
首先对时延补偿后的含噪语音信号通过傅立叶变换计
算其倒谱 其次在倒谱域求最小相位分量 , 并对其进行
波束形成 , 再进行低通滤波 然后利用人耳对相位信息
的不敏感性 , 用含噪语音信号的相位来合成增强后的
语音 , 以减小计算量 。 该方法思路简单 , 计算复杂度不
高 , 可以在混响环境下有效地实现语音增强 。
本文第二部分给出了接收信号模型 , 第三部分介
绍了房间冲激响应 , 第四部分给出最小相位倒谱理论 ,
第五部分说明了本文方法的基本原理与实现步骤 , 第
六部分给出了计算机仿真结果 , 最后是本文的结论 。
一 ‘ , 了一 少‘ , 一 , 无 , 」, 。 为声速 ,
这里 、 和 分别为房间的长 、宽和高 , 和 ’分别为
声源坐标和麦克风坐标 。
若各个墙面的反射系数均相等且等于 下 , 则式
可化简为
, , ‘ 艺 至, 一 ’,
· ’, ‘一 ’, ’‘ ’, ’爪
一‘ ’, ’。
占 卜 ,
二 ,
当房间大小为 米 米 米 , 墙面的反射系数
二 时 , 混响时间约为 , 房间冲激响应曲线
如图 所示 。
信号模型
假设声音传播满足线性波动方程 , 这时声源和麦
幅
度
克风间的通道可认为是线性
系统 。 若 个麦克风线性
均匀排列 , 间距为 , 声源人
射角度为 , 信号模型如图
所示 。
陌片一川时间
图 房间冲激响应
城 二 材
图 信号模型
则第 ‘个麦克接收的信号为
‘
其中 为声源信号 , 、 为房间冲激响应 , 为
噪声 , ’ ‘为卷积运算符 。
沪、
、,了了汀、
‘爪
八
房间冲激响应
在小型会议室中 , 由于房间墙壁反射等原因 , 使得
语音信号在房间内进行多径传输 , 从而产生混响效应 。
通常 , 用混响时间来表征房间的混响程度 。 假设房间
内各个墙面的反射系数均相等且 为 , 按照 州 公
式 , 混响时间 印可以表示为
最小相位倒谱理论
信号 人 。 的复倒谱 人 。 定义为〔”
人 。 二 入 。 卜 厂 , 田 。 〕
这里符号 ’八 ’表示倒谱 , 表示复倒谱算子 , 是复
对数算子 , 一 ’表示傅立叶反变换 。
通常 , 信号可在倒谱域分解成最小相位信号和
全通信号 。 令 。 。 。 表示 复倒谱的
最小相位分量 , 根据傅立 叶变换性质和倒谱定义 ,
复倒谱的最小相位分量 、。 可表示为
几
一卫兰丝 里
, 一 一
式中 和 分别表示房间的体积和总面积 。
通常采用 模型 〔’“ 〕来模拟房间混响 。 假设墙
面光滑 , 呈镜面反射 , 但每次反射都会损失部分声波能
量 , 这种往复的反射现象可 以等价为一系列强度衰减
的镜像源 。 若能找到所有镜像源的强度和位置分布 ,
便能得到房间冲激响应 。 模型产生房间冲激响
应的计算公式为
“ ‘ , , ‘ , 二么垦
二刀夕
一 ‘ ’。打’。 一 ’。儿’月犷一 ’。 ,
人厂 ,
人 。
,
这里 是 的实倒谱 。 利用式 , 就可实现
人 人 ‘。 , , 的分解 。
占 卜 ,
,
,
,
其中夕 〔 」,
凤 是房间各面的反射系数 ,
,月 , ,月二 ,月, , ,月, ,月 ,
二 〕,
本文的倒谱域语音去混响方法
本文倒谱域语音去混响方法的原理框图如图 所
示 。 该方法首先将接收到的含噪语音信号时延补偿
后 , 通过傅立叶变换计算其倒谱 , 并在倒谱域求出其最
小相位分量 考虑到语音倒谱信号的最小相位分量大
都集中在低频部分 , 因此在倒谱域内进行波束形成后 ,
再进行低通滤波 , 以滤除混响成分 。 其次 , 利用人耳对
相位的不敏感性 , 仅利用一路麦克风接收的含噪语音
© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net
第 期 一种适用于混响环境的麦克风阵列语音增强方法
结论
本文利用人耳对相位的不敏感特性 , 采用 了一种
近似的手段 , 从含噪的语音信号中提取相位信息 , 从而
提供了一种新的麦克风阵列语音去混响方法 。 与传统
的倒谱域语音增强方法相比 , 该方法具有更低的运算
量 , 可应用于实际需要考虑混响的视频会议系统中 。
仿真结果表明了该方法的有效性 。
参考文献
仁 , ,
一
一 一 一
罗
, , , 加 一
厂 」 一
, , ,
, , 一
〔 〕 , 助
, , , 一
〕 , 一
,
’ , , ,
,
,
,
一 一
一
, ,
, , , 一
,
邵 , , 一
〔 」 阎兆立 , 杜利民 , 改进的后滤波波束形成器语音增强算
法 , 电子与信息学报 , 《 巧 , 一
【 」 一
,
,
, ,
一
仁 〕 , , ,
· ·
,
, 一
」 , 叮
一
,
, ,
一
仁川
, ,
, , ,
一
」马晓红 , 陆晓燕 , 殷福亮 , 改进的互功率谱相位时延估
计方法 , 电子与信息学报 , 《只 , 一
作者简介
张丽艳 , 女 , 年生 , 博士生 , 讲师 。
大连理工大学电子与信息
工程
路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理
学院信号与
信息处理专业博士生 。 主要研究方向为数
字信号处理 , 麦克风阵列语音处理 。
殷福亮 , 男 , 年生 , 博士生导师 ,
大连理工大学电子与信息工程学院教授 。
主要研究方向为数字信号处理 , 语音处理 ,
图像处理 , 宽带无线通信技术 。