首页 声学语言清晰度指数的计算方法

声学语言清晰度指数的计算方法

举报
开通vip

声学语言清晰度指数的计算方法 mU三 A 5, 534-843.5:801.4 暑旨 中 华 人 民 共 和 国 国 家 标 准 cB/T 15485-1995 声学 语言清晰度指数的计算方法 Acoustics- Methods for the calculation of the articulation index of speech 1995一07一03发布 1996一02一01实施 国 家 技 术 监 督 局 发 布 中华 人 民 共 和 国 国 家标 准 声学 语言清晰度指数的计算方法 GB/T 15485...

声学语言清晰度指数的计算方法
mU三 A 5, 534-843.5:801.4 暑旨 中 华 人 民 共 和 国 国 家 标 准 cB/T 15485-1995 声学 语言清晰度指数的计算方法 Acoustics- Methods for the calculation of the articulation index of speech 1995一07一03发布 1996一02一01实施 国 家 技 术 监 督 局 发 布 中华 人 民 共 和 国 国 家标 准 声学 语言清晰度指数的计算方法 GB/T 15485-1995 Acoustics- Methods for the calculation of the articulation index of speech 主题 内容 与适 用范围 由于语言清晰度试验繁复费时,现已发展了一种与语言可懂度高度相关的可计算的物理度量,象组 织一组发音人和听音人来进行言语感知试验一样的评价语言可懂度。这个物理度量称之为清晰度指数, 简称Al, AI是在给定的语言通道和嗓声条件下,表示对一个听音人获得语言可做度可利用的正常语言 信号的有效比率(部分),它是一个加权的分数,由测量或估计的语言频谱和在听音人耳边存在的噪声的 有效掩蔽谱可计算Al, 本 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 描述了计算清晰度指数AI的方法和 步骤 新产品开发流程的步骤课题研究的五个步骤成本核算步骤微型课题研究步骤数控铣床操作步骤 并给出AI与音节清晰度之间的函数关系。 本标准所述的计算方法的根据是男女成年正常发音人,以汉语普通话发音和男女成年正常听音人 的平均结果。本方法中的数据不适用于儿童。 本标准所述计算清晰度指数AI的方法,部分采用美国国家标准ANSI S3. 5-1969Q语言清晰度指 数的计算方法》。 术语 2.1清晰度指数 articulation index 通过大量语言清晰度试验,导出的具有颇带可加性的用来计算给定的语言传递系统语言可懂度的 一个指数。它取值在。与 1之间。 2.2 长时均方根声压谱 long-term root mean-square (rms) pressure spectrum 语言信号的声压振幅与频率的函数关系。可采用多种方法来测量。在1/1倍频带和1/3倍频带语 言分析中,对于正常连续语言,采用is的积分时间,可得到稳定的长时颇谱。所测得的均方根值的数字 表示称为长时均方根声压,以区别于采用较短积分时间,比如一个语音的平均时长1/8 s测得的均方根 值。 2.3 谱级 spectrum level 信号在某一频率的谱级是以该频率为中心 1H:带宽内测得的声压级,以分贝表示.基准声压 20 jLPa, 当测址滤波器带宽为△f(Hz)时,连续语言的声压谱级等于测得的频带声压级减去10 log,}Af e 2.4 1/1倍频带和1/3倍频带谱 octave and one-third octave band spectrum 当测量采用 1/1倍频带或 1/3倍频带滤波器时,以分贝计的频带声压级与1/1倍频带或1/3倍频 带的中心或边界频率的函数关系,称为1/1倍颇带或是1/3倍频带谱。 注:① 一个遮波舒的均方根声压级数值,是指在它的几何中心或中心频率. ② 一个滤波器通带的上下截止颇率是指滤波器正弦信号响应最大值频率上下低干最大响应 3 dB处的频率 ③ 本标准要求所用沁波器衰减曲线的斜率不小干每倍频程18 dB, 国家技术监任局1995一07一03批准 1996一02一01实施 GB/T 15485- 1995 2. 5 iu言峰值 ,peech peaks 1/8 s平均时间语言信号的均方根值有百分之一超过长时平均值12 dB或更多。采用长时平均有效 值加12 dB作为对语言可懂度有贡献的语言峰值振幅。 2.6 总声级 overall level 用C计权测得的声压级。长时总均方根声压级近似等于语音平衡词表各个词的峰值声压级的算术 平均减去3 dB,测量时声级计置于通信系统传声器所在位置,要是对面交谈则置于听音人耳所在位羚。 声级计测过时应在安睁条件下,放在慢档和C计权。读语音平衡词时应在正常条件下发音。 2.7 截幅 peak clipping 当输入于一个放大器的瞬时电压,超过某一限定的线性增益值时出现的效应。 2.8 连续谱声音的听阐 threshold of audibility for sounds having continuous spectra 在安峥环境中采用连续谱声音进行听力测试,50写的试验能引起听觉感受的最小信号声压级. 2.9 语音平衡词试验 PB(phonetically balanced) word test 语音平衡词试验使用单音节词表,每表75个音节(词)。这些音节是经过精选的,它们所包含的基本 语音的比例与日常口语大致是一样的。 2.10频带感觉级 band sensation level 额带声压级与该频带的听闭之差,以分贝来表示。 计算方法 i卜钟Al可采用下述两种方法。 20颇带法:本方法基于在20个相邻的等清晰度频带(见表1)中测量或估计的语言谱级和噪声谱 级。在安挣环境中,语言峰值的谱级超过听阐30 dB或更多,每一频带中的语言成分对语言可懂度的贡 献都是相等的。 表 1 汉语 20个等清 晰度频带 Hz 频带 号 频带边界 频带宽度 中心频率 1 , 3 I 5 6 7 8 9 10 I1 12 13 14 IS 200^-400 400- 550 550- 730 730^ -900 900 -^1 020 l 020--1 150 1 150- 1 270 1 270--1 400 1 400-1 520 1 520-1 700 1 700^ -1 900 1 900--2 100 2 100^ -2 400 2 400^ -2 700 2 700-3 000 200 150 180 170 120 130 120 130 120 180 200 200 300 300 300 300 475 640 815 960 1 085 1 210 1 335 1 460 1 610 1 800 2 000 2 250 2 550 2 850 GB/T 15485-1995 续表 1 Hz 频带号 颇带边界 频带宽度 中心频率 16 17 18 19 20 3 000-3 400 3 400--4 000 4 000^ 4 700 4 700^ -5 700 5 700^ -7 000 400 600 700 1 000 1 300 3 200 3 700 4 350 5 200 6 350 1/3和1/1倍频带法:它是由20频带法导出的,只是要求测量或估计语言和噪声是在1/3或整个 倍频带. 注:① 下面数节将详述用上列方法计算Al.与计算有关的函数 一 理想语盲谱、听网、不截幅语言的最大允许声 级,在图1和表5中给出.这些函数的根据是:汉语标准颇谱和国家标准:GB 4983自由场纯音标准等响曲 线。表5中对于12 dB和24 dB的截幅语言的最大容许声级的曲线分别在不截幅语言的最大容许声级之上 6 dB和 12 dB(参照图1). ② 1/1倍颇带法对语言和噪声谱的变化不如20频带法和 1/3倍颇带法灵敏,因而也不精确。当掩蔽噪声的能 量明显集中在一个倍频带或更窄的范围内时,1/1倍颇带法不可使用.这时应采用1/3倍频带法,最好采用 20颇带法。 ③ 在文献中报告结果时。一定要说明所使用的Al计算方法.即Al (20颇带).人1(1/3倍频带)或Al(1/1倍颇 带). 3.1 20频带法 3.1.1 步骤1 在计算图(见图1)上绘出已知的或估计的听音人耳处的语言峰值谱级。 语言峰值谱级可用下列诸项代数和方法近似得到。 3.1.1.1 所评定的系统的频率响应,以分贝计。每一颇率的频响是听音人耳处的声压级与发音人在传 声器处在该频率上的声压级之差,以分贝计。 注:必须注意保证叔率响应完全反映整个系统的发送和接收换能器的特性。 3.1.1.2 理想化语言颇谱的确定 a. 图’1理想化频谱是在长时总均方根声压级为65 dB时测得的。当测得的或估计的长时总均方 根声压级与“dB不同时,按两者的差值上下移动曲线。 注:图 1中理想化颇谱严格应用在距发音人唇部 lm远荃本上无混响和无噪声的环境中.在这些条件下,在发音人 唇前2. 54 cm到lm之间侧量语言孩谱时,这个颇谱的形状都相当精确.因此,语言声级可在靠近发音人唇部处 测量(或估计),所得教值可依平方反比定律换算成 1 m处的值,并且假定一个等效点声源是在发音人唇后 0. 6 cm处.这个导出值就可以与65 dB来比较,以得出理想化语言频率谱级所需的调整值。 b. 当语言是在一非消声室,非自由声场中以扬声器放声时要按表2进行校正。 表 2 对混响或半混响房间中的扬声器所放出的语言声级的校正 语言总声级,dB 应从语言声级中减去的校正量.dB 85 90 95 100 105 110 0 2 4 7 11 15 CB/T 15485- 1995 续表 2 语言总声级.dB 应从语言声级中减去的校正址.dB 115 120 125 13U 19 23 27 30 日:友2中给出的校正值不适用于语言通过耳机放声或在自由声场中以扬声器放声. 这个校正值是根据实验得到的,它表明在这种情况下,语言声级的提高会引起可横度降低。例如.似 定在 混响房间中二扩声系统的长时语言总声级为95 dB,就要向经过按3.1.1.1条所述系统频率响 应特性校正的理想化语言频谱加上26 dB,即95 dB-65 dB-4 dB(表2校正值)。从而得出这个扩声系统 的有效语言A 3.1.2 步骤2 把A达听音人耳处的稳态噪声校正谱级画到图1上.几种噪声源,例如,听音人所在的环境噪声和 通to语言传递系统到达听音人的噪声,均方根声压要加在一起。 31.2.1 校正噪声iii 当噪声的频带感觉级超过80 dB时,噪声掩蔽的有效性要比正常比率增加得更快。在AI计铆中这 种增加的掩蔽可对噪声声压级增加一个校正量来加以考虑。一旦噪声感觉级在一个频带的中心频率卜 1M1}P的那些垂直线)超过80 dB,则在这 点上的嗓声声压级便按表3所给的数值增加 ·个适当的 {落卜 噪声感觉级可由噪声谱级减去听力闭限谱级来确定. 表 3 对掩蔽非线性增长的校正量 频带感觉级,d 1i 应加到嗓声声压级的校正址.d” 80 85 90 95 loo 105 I10 于1[ 120 125 130 135 I-to 145 】5〔, 0 1 2 3 4 5 6 7 8 9 to 11 12 13 14 在计钓图(图1)七绘出嗓声有效掩蔽谱级。在任一频率上的有效掩蔽谱是由噪声谱、校IF.噪,侧片或 GB/T 15485-1995 者在该频率上的延伸掩蔽噪声谱中的最大的一个来决定。掩蔽噪声谱的延伸由下述方法画出来。 3.1.3.1 首先确定噪声掩蔽谱延伸 在最右边纵轴上找出比噪声谱或校正噪声谱的每个最大值低3 dB 的点.再由最高的点作水平线与噪声谱相交。这些点称为“起始点”。 注:① 噪声诺只有一个最大或峰值的时候那就只有一个起始点。 ② 要是噪声谱在7 000 H:或更高频率有峰值.则起始点就定在比5 700 H:低 3 d[3处。 3.1.3.2 从每一个起始点垂直下降57 dB,再以10 dB/occ的上升斜率向左画一直线,这直线便是掩蔽 谱的低频部分‘ 3.1.3.3 从每一个起始点向右画水平线到一定长度后再以一定斜率下降。水平部分的长度与下降的斜 率、每个起始点所在的频率以及在该频率上的噪声最大谱级,见表4。这些条线代表延伸掩蔽谱的高频 部分 男女FU平均即个等清晰度欺带中心倾率‘呛友I1 领带兮 I 5 n 7邢9 IN 12 14 19 18 20 I 厂,F「 }lm门下 m 日 }{ 一 今李厂一二过门日 {lmm门}i}门 }}LamIL b卜拟比 {」旧叮门 }【i」r-扮七~呜、 吕 二之E落曰斗扫11砷冲脚二粤日二二c-- I 十片 }1!1厂刃门臼 }I I1 1}ffI 产勺门门 1}}}门们 {{1{}1 }一下门 门 1111盯TI{}1}{1 }口下门 门 {}日}汀们 {}}{}} {} 厂门门 门 {川 }叮1下I}I{}I B-.一 I} {} l卜弓州排 「Tl-}I{{I{}} 「一]门日「}不刃门}}}111} 一I 厂一曰「「n--n--平淤阵迁}I 厂,下日口吓m 厂了厂门口可m }{}川 }}}门} ‘,、州反 「一刃口门口mm {II!m }I} }盯~ }二{曰n口 11}}}}}I}Z 厂一门叮〕 汁俐之 I匕卜尸} 门 门阳 可汗丁下丁1111曰 厂丫口日习厅甲 }{}}}III{ ! }} 1一『不曰曰刀可m }}}1111川 !}.i . LA ??? ? ? ? ? ??。?,?? ? ? ? ? ? ? ?? ? ;‘一IJj。 6 了 月 4 1,1001. 翎率 日2 图 1 20频带法AI计算图 最大容许声级:。一语言峰值截幅2.1 dB; b一语言峰值截幅 12 dB, c 不截幅语言。 比上述曲线高的语言峰值对语言可懂度无贡献. 汉语普通话理想化语言颇谱一 男女声 长时颇谱(rms)+12 dB(长时rms总声级为 65 dB). 连续谱声音的听阅谱级。 GB/T 15485-1995 噪声最大谱级或 校正后的潜级, 用其中较高者 ‘基准声压20 pp.) dR 表4 掩蔽谱的高频段— 掩蔽的上延伸 起 始 点 颇 率” 50^ -800 Hz 800^ -1 600 Hz 1 600--2 400 Hz 2 400^ -3 200 HO 200 H- 7 000 Hz ? ? ? ? ? ?? ? ? ? ?? ? ? ? ?? 8 1 000 13 1 000 18 800 500 3 000 500 3 000 ::3 000 ? ? ? ? ? ? ? ? ? ? ? ? 96 86- 95 76--85 66- 75 150 2 000 500 ? ?? ?? ?? ?? ?? ?? ? ?? ???? ??? ??? ??? 56^ -65 150 46-55 100 40 200 200 25 800 20 40 200 40 ? ? ??? ? ? ?? ?? ?? ?? ?? 注:1) A 从起始点向右画水平线的颇率(Hz)数; 2) 刀 从水平线右端点往下画斜线的斜率(dB/ort) ; 3.1.4 3> 起始点颇率值的确定参见3.1.3条。 步骤 4 在2。频带每个颇带的中心频率均指示在图1上,确定出语言谱级和有效掩蔽谱级的分贝差值。当 差值为。或小于。时,就定其为。,当语言谱级超出有效掩蔽谱级30 dB时,就定其为30, 注:(i.) 在计算图(图D上听闻曲线高于有效掩蔽谱的部分就当作最小噪声谱。 ② 当语言峰值曲线超出图1中所标的最大容许声级时,则最大容许声级就作为语言峰值声级。 3.1.5 步骤5 将在步骤4中所求得的20个差值加起来除以600,所得到的数值便是给定通讯系统在噪声条件和 对所给定语言声级下的清晰度指数。 3.1.6 举例 用20频带法计算AI的一个说明性的例子示于图2, Gs/T 15485-1995 男女声平均211个娜清晰度橄带中心绷率(见表U 孩带 号 1 5‘7 88 10 121 14 18 18 厂一门门 II汗下「口印口二口口 厂,曰门 }IITT厂阳可口了口口 厂一门口 I!厅下厂印叮门,曰曰 厂二门口 }{『「门印叮口下口口 厂甲口口 }}汀下尸可团口二口口 }} 压二口口 }}叮 口口叨曰二 }a 一 { 了5汗日I n比「日l浏口口111 ’、、红 。} {I曰 1一I砰不〔梦日日「{1!刊}一厂一’11}七J口 }}『座》卜gLll理 { 一} 【,了 I-'褚.麟}}}一田〔五己r}「了一曰口「拜 田扑IT禹巨丫曰日1 I 0_ /日团团厂,曰日 }:’-「日压口 [田 I曰 门 厂一曰日 }I「「田团 ]田 !曰 厂了门日 }}日厂!卫田]用 }曰 「丁厂厂I丁「r日团曰 日I月 I门 「二厂!一!}一日口团团 日田 I曰 ! a h五一旧斤1!I[』口田田 口田 T 曰 1)1 ?? ?。? ? ? ? ? ? ? ? ?? ? 7 6 9 11,01, 5 6 7 8 9 looms 绷串 Hz 图2 20颇带法计算AI示例 A 语言峰值谱级— 长时颇谱(rms)十12 dB (长时 rms总声级 95 dB). B 嗓声谱级(总声级113 dB). C 嗓声掩蔽级(见表 3): a 掩蔽向上延伸布 b 掩蔽向下延伸。 3.2 1/1倍颇带法和1/3倍频带法 3.2.1 步骤1 根据所用的带通滤波器测定出到达听音人耳处的语言声压级。 注:1/3倍颇带和1/1倍颇带滤波器的中心娜串在表 5中给出。 语言峰值的颇带声压级可用下列数值的代数和来近似: 颇带号 语言峰值与噪声或听闹掩蔽的差 ?? ?? ? ? ?? ,? , ? ?? ?? ? ? ? ? ? ? ? , cB/T 15485-1995 颗带号 语言峰值与噪声或听闭掩蔽的差 ?? ?? ?? ? ? ? ? ? ?? ? ? ? ? , ? ?? ? ? 、? ?? ? ?? ? ??? ?? ???? ???? ?? ???? ?? ???? ?? ??、 ? ?? ?? ?? ? ?? ??、 ? ?? ?? ? ? ? ? ?? ? ? ? ? ?? ? ? ? 14 15 16 17 ? ? ? ? ? , ? ?? ? ?? 艺= 239 AI二239/600=0.40 图2113中心频率处读值与AI计算 3.2.1.1 被评价系统以分贝表示的频率响应特性。在每一中心频率处的颇率响应是听音人耳处的频带 声压级与在发音人传声器处该频率的声压级之差(应注意保证频率响应要完全反映整个系统的发送和 接收换能器的特性) 3.2.1.2 汁31理想化语言频谱 a. 按着测得的或估计的语言长时总声级(rms )与65 dB之差来移动理想语言频谱,即在表5中相 应的频带的理想化语言频谱数值加或减去这一差值。 b. 在一个非自由声场或非消声室中以扬声器放声时,语言长时总声级要按表2指示的数值来降 低(表2中给出的校正值不适用于通过耳机呈现语言或在自由声场中使用扬声器放声)。 注1表5中的理想化语言领谱严格地适用干在基本_L.无混响无噪声环境中距离发音人唇部1 m处。 3.2.2 J V-骤2 计1)出到达听音人耳处的稳态噪声的频带声级。从几个声源,例如,听音人所在的环境噪声和通过 语言传递系统到达听音人处的噪声,其有效声能要加在一起。 注 当九 个时可做度有贡献的4f带的中心频率上 ]/1倍频带或1/3倍颇带的感觉级超过84 dB时,语言和噪声频 潜就要变换成讲级的值(见2.3条),并将其结果画到图1上.这样就要采用3.1.1到3.1.5条所述的20频带法 来计界AI.变换成谱级的目的是为了能在计算AI时考虑到非线性和延伸掩蔽效应.这种延伸掩蔽效应在颇带 GB/T 15485-1995 感觉级超过84 dB时就变得显著。 表 5 理想化语言频谱+12 dB、有效听阑频谱和对连续谱声音不截幅语言的最大容许声压级 20个等清晰度频带中心频率的 1/3倍颇带中心频率 1/1倍孩带中心搜率 谱 级 频带声压级 孩带声压级 中心频率 A B c I中心频率 A B c w I中心频率 A B c w dB ? ??? 50.0 dB 一 7.0 dR dB dB dB dB 67.0 50.0 一14.0 48.0 一16.0 45.0 一 16.0 .68.0 ::.: 0.000 40.001 0 72. 574.0 ::‘: dB 140 0.002 4 136 0.004 8 ‘9.0 68.0 12.0 70.0::.: 0.001 00.001 4 62.0 10.0 129 0.007 4131 0.010 9 ? ??? ??? ? ? ???? ? ? ? ? ? ? ??? ??? 43.0 一 16.0 68.5 9.0 ?? ???? ??? ??? ??? ??? 41. 0 一 16.0 100 7.0 0.001 4 0.002 0 57.0 10.0 140 0.007 8 66. 5 ??? ??? 0. ??? ??? 65.0 8.0 ????? ??? ??? ??? ??? ??? ??? ???? ? ? HZ 300 475 640 815 960 1 085 1 210 1 335 1 460 1 6:0 1 800 2 000 2 250 2 550 2 850 3 200 3 700 4 350 5 200 6 350 39.0 一 17. 0 37.0 一 17.5 64.0 8.5 ? ? 36.0 一 19.0 250 62.0 0.003 0 ??? ??? 34.0 一 20.0 600 60. 5 :.: 0.003 7 ??? ??? 32. 0 一 22.0 2 000 59. 5 5. 5 0.003 7 2 500 58.0 3.0 0.003 4 ?? ?? ? ? ? ? ? ?? ?? 30.0 一 24. 0 28.0 一 26. 0 3 150 56.0 1.0 0.003 4 ??? ??? ? ? ??? ??? 26.0 一 28.5 4 000 53.0 5.0 0 24.0 一29.0 99 1 5 000 51.0 12.0 135 0. ? ??? ??? ??? ??? 22.0 一30.0 ::.:一30.0 二::.: 0 一20.0 ?? ?? 注:A为理想化语言频谱十12 dB; H为有效听闷绷谱, C为连续谱不截幅语言的最大容许声级。 W为计算AI 的计权值。 3.2.3 步骤3 计算每一频带的中心频率上语言峰值频带声压级与噪声的颇带声压级的分贝差值(n>。要是这一 差值为。或小于。,就定差值是。。要是语言频带声压级超出噪声颇带声压级30 dB或更多,则定此差值 为 30, 注:① 当听闭曲线超过噪声颇带级的地方就把听阅当作最小等效嗓声孩带级. ② 语言峰值超出最大容许声级的地方,最大容许声级就作为语言峰值声级. 3.2.4 步骤 4 GB/T 15485-1995 根据表5W列所列计权值(W)与3.2.3条步骤3中得到的差值(D)相乘。 5 步骤 5 将DXW的数值相加。得数便是这一语言系统在给定的噪声条件和指明的语言声级下工作的Al, 各种因素对AI的影响 4.1 Al所评价的因素 语言清晰度试验得分受施加于所传递的语言信号上的诸多条件的影响,至今仍不完全清楚也不能 完全定址。然而,在运用Al原理时,有一些因素是可以定量估计的。它或是个别出现或是结合在一起, 除下述4.2条以外。这些因素如下。 4.11 稳态噪声掩蔽 Al可预测宽带连续噪声的影响,以及频率范围在200^-7 000 H:频带宽度大于200 H:的噪声的影 响。 4.1.2 非稳态噪声掩蔽 非稳态噪声对语言可懂度只在一部分时间内有影响称为作用周期。当噪声不是稳态的并且起 止作 用周期是已知的,可以把噪声当作是稳态的来计算,以后应用图3对所得到的Al值加以校正就可得到 有效的Al值。这种方法只适用于噪声在作用周期中起始期的噪声级高于停止作用时期20 dB以上的情 况。 4.1.2.1 噪声中断率 对一有着确定的起一止作用周期的噪声的通讯系统。按照4. 1.2条和图3的方法算出的有效Al,还 要进 一步根据图4中所给的函数来做调整.图4上横坐标是噪声的每秒中断次数,纵坐标是在给定参数 F的有效Ale 4.1.3 语c信号的颇率畸变 频率畸变是信号传递时对不同频率的增益不相等。它对语言可懂度也是有影响的。这些彩响利用 Al可以考虑得相当精确。计算Al时对下列因素给以不同的侧重。 a. 语言信号的高频成分; b. 低频成分; c. 中频成分。 可是,要是语言信号的长时频谱很不规则,也就是频谱有一系列峰和谷,平均的峰谷斜率超过 18 dB/oct时,Al对语言可懂度的估计就不太可靠了。 4.1.4 语言信号的振幅畸变 计算的Al可以估计明显的对称截幅对语言可懂度的影响,可采用下列步骤。 4.1.4.1 步骤 1 由图5来确定由一特定的截幅值和在一个系统中截幅后的放大量所造成的语言长时均方根声级的 提 高。 GB/T 15485-1995 加七吸声的时间比串 ?????? ?? ? ?? ?? ?? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ? ? ? ? ? ? 图3 对不同嗓声持续因数的校正 注:纵坐标表示对不同噪声时间分数按照稳态噪声掩蔽所得到的 At值应加的修正量.AI修正值不能超过 1.0. 0.9 0合吕 二长一 0.,..‘~一. 口 .. . . ., 一 一尹户 l 子 飞女\,、‘~ 0.吕一 一 一 沪口产次 皿 谷 r} 0.7林 .种口 尸尸 一 一洲1 711一\阅丫丫卜、 0.6 ////\\又\卜~进 1 川尸 」 、’一 已 .、\\贬。.; v 夕尸 / \丫杖\匕,.: 了 \\ ~ 爪2 \、 下 ?? ? ? ? ? , ? ? ?? ?? ?? ? ?? ?? ?? ? ? , ? ? ? ? ?? ? III IINI I IN川 10.01川 睡秒中断次肚 图 4 有效AI与中断频率的关系(从图3读AI校正量) 注 该图 大I;右效 11道与掩蔽嗓 知!,断次教的f.系曲代上的系数是对稳态噪声掩蔽计算所得的 AI值按图3对 IFS'. ,持续时间子以修正后的结果。 4.1.4. 2 步骤2 将步骤1的结果加到语言峰值声级(非截幅语言的长时均方根十12 dB)这便是听音人耳处非截幅 语言和截幅后放大语言的声级。 注:截幅后放大定义为对通信系统所加的放大量,使得峰一峰振幅达到与非截幅语言的振幅相等。语言的蜂值振幅 it cB/T 15485-1995 定义为有百分之一时间超过的振幅。如果截幅后放大量,以分贝计,不等于对语言信号所加的截幅值,在步骤 1 中得出的长时均方根值的提高址就要降低一个量.这个量等于蜂值截幅与截幅后放大址之差. 4.1.4.3 步骤3 将步骤2的结果绘于AI计算图上,依次按照以前所述计算AI.注意AI计算图上的最大容许声级 对于截幅语言要比非截幅语言高。 注:一般来说.蜂值截幅仅当语言信号在截幅前相对地没有噪声而在收听处有嗓声或者在截幅后有噪声混入时才 使用。 4.1.5 混响 房间中的混响将造成语言可懂度降低。降低的程度与房间的棍响时间有关。混响时间定义为声源 停止后一个稳态声降低60 dB所需的时间。 当混响时间已知时,可利用图6来校正对一个给定通讯系统求得的AI这个校正址要加到由表2修 正后所得到的AI值上。 4.1.6 说话声级 一个说话人声级很弱或很强都将降低语言可懂度.在其他因素保持不变的情况下,要是说话声级平 稳保持在50 dB到85 dB(距说话人唇部1 m远测得长时均方根声压级)之间,一个给定的A1值可以是 精确的。要是通讯系统中使用很弱或很强的说话声级,在AI计算图上就得画出有效声级而不是测得的 语言声级。实际语言声级和有效语言声级之间的关系示于图7. 4.1.7 视觉线索 由观察说话人的双唇和面部而得到的视觉线索对语言可懂度有很大帮助,特别是在有噪声存在的 时候.可是,可以改变或调整一个AI使之成为一个“有效AI"以反映一般没受过“唇读”技术训练的听话 人的视觉线索对语言可偷度的影响(见图8). 4.2 AI不能估计的因素 有不少影响语言通讯系统的因素在现行的AI中不能估计。特别是下述几项。 4.2.1 说话人性别 如前所述本方法是根据男女发音人进行清晰度试验的平均结果而设计的。因而.当个别男或女说话 人使用语言通讯系统时的语言可懂度可能与估计值略有出入. 4.2.2 多传递通道 听话人从说话人直接接收的与同时还从一个扬声器接收的混合语言信号对语言可懂度的定址姗响 还不清楚.因而,AI可能不适用于这种系统。 4.2.3 多因素组合 当几种失真综合出现,如截幅、加中断噪声、加混响,目前还没有充分试验足以说明在可能的因素组 合时,确切AI值应如何。 4.2.4 非对称截幅.频率偏移和衰落 本标准只适用于通讯系统的非对称截幅不超过3 dB,信号的频率偏移不超过50 Hz.并且没有明显 的衰落变化。 GB/T 15485-1995 曰 洲行日 洲丫 /叼 洲不 / / 团 ??? ?? ? ? ? ? ?? ?? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? n 3 4 12 15 IA 21 别 峥伙截栩It (dB) 《峥曲拐度由时时栩度分布中.).川橄书水平来定义) 图5语言声级与峰值截幅的关系 注:该图表示当截幅级上升到截幅参考级时.rmn语言级增盘与截幅t的关系. 贬).S ”.7 0.6 0.5 U.丢 :一: 门 }华一团 口 / 尸 口 「 一} } / } 口 口 {/ 口 门 /v 口 厂二}月淤 一} 口 口 / }口 口 二2一 口 ? ? ? ? ?? ? ? W晌时间csi 图6 AI的混响时间校正 注:该图表示 AI的校正贵.AI不能小于 。,。,当校正后的 AI小于 0.。时按 。.。计算。 13 GB/T 15485-1995 一/} 一二 {I !万{ / 知 日 / 日 / 门 / 尸 ] / 口 口 一.一一一. 月,一 .... ?? ? ? ? ? ? ? ? ? ? 如 翔! 以〕 711 阳I 卿 1阴. 朴发内人!m处实际语.丫级.长时rms位 IdB 一峨准声压m.Par 图7 发音人实际语言级与有效语言级的函数关系 ?? ? ? , ? ? ??? ? ????? ,? ?? ? ???? ? ?? ? ??????????? ? ? ? ?? ? ? ?? ? ? ? ? ? ? ? ? 1.2 仆。1 l] 巨 厂 一} // ll / / /尸丫 州Z / 丫 / / 矛/ / s 口 n ,i. I 月.2 日I 11. 1 u.., 11.6 11.7 0.8 11.4 1.11 Alit流仇 图8 在听音人可看到发音人唇与面部的通讯系统中 AI计算值与有效AI值的函数关系 5 单耳呈现与双耳呈现 对于有正常双耳的人,单耳或双耳倾听,测得的语言可懂度是可以比较的,并且也是可用AI预测 GB/T 15485-1995 的。然而,当听话人用双耳倾听来自分离声源的语言和噪声时,由于在给定的各频率上双耳对于语言和 噪声产生的相位关系是不同的,这样用双耳听到的语言可懂度就会与用单耳听到的不同。除了在4.2.1 到4.2. 4条中所提到的情况之外,AT是可以预测在各种双耳倾听和所有单耳倾听条件下的相对可懂度 的 。 AT与语言可恤度的关系 利用图9中所给的曲线,就可以把AT转换成估计的语言可懂度。图9中所给出的曲线仅对一组给 定的发音人和听音人是有代表性的。应该特别注意的是,清晰度得分与对被传递的消息所加的约束有很 大关系的。典型的约束包括语法结构和上下文(例如,在句子当中),词汇量大小,以及单词中的音节数。 没有一个单值的AT可用来作为“可接受的”通讯的标准。图9中所示的通讯效率,也就是清晰度试验得 分与AT的函数关系,与所传递的消息的范围和发音人与听音人的熟练程度有关。当使用一个给定的通 讯系统在给定的条件下,用不同的发音人和听音人小组或者同一个发音人和听音人小组在不同的时间, 得到的清晰度试验得分有差别,这并不表示AT不可靠。 如前所述,AT是用于预测通讯系统的相对性能的。通讯系统是在一定条件下工作,测试时使用指定 的典型的发音人和听音人小组,并且训练时听音人一发音人熟练因数保持恒定,或者对于不同的测试,要 由恰当的试验程序来加以控制。AT已经利用这种试验证实是可靠的了,其可靠性是依据在一次指定的 试验中随着AT值的提高测得的清晰度试验得分也稳定一致地增长。 当然,对一指定的通讯系统所要求它的性能水平如何是与多种因素有关的。这些因索的重要性.只 能由通讯系统的使用情况来评定. ? ? ? ? ? ?? ? ? ? ??? ? 图9 音节清晰度、单词可懂度和单句可懂度与AT的函数关系(男女平均) A一三音节词(语音平衡词表中48个词); B一单句; C一双音节词; n--单词(句括不同词的长度); E一音节 GB/T 15485-1995 附 录 A 参 考 文 献 (参考件 ) [13 American National Standard ,Methods for the Calculation of the Articulation Index ANST S3. 5, 1969. [23 DUNN,H. K. and S. D. WHITE,Statistical measurements on conversational speech. J. Acoustical Society of America, Vol. 11, 1940, pp 278-288; Bell Telephone System, Technical Publication Monograph 11-1206. [3」张家绿,马大献,导出清晰度指数新方法.声学学报,卷2.No.2,1965,pp 80-84. [4」马大献,张家绿.汉语标准颇谱,声学学报,卷2,No.4.1965.p217. [5] KRYTER,K. D. Effects of ear protective devices on the intelligibility of speech in noise. J. Acoustical Society of America,Vol.18,1946,pp 443-447. [63 KRYTER, K. D. Methods for the calculation and use of the articulation index. J. Acoustical Society of America,Vol.34,1962,pp 1689-1697 [73 CARTER,N.I.and K. D. KRYTER, Masking of pure tones and speech. J. Auditory Research, Vol. 2,1962.pp 66-98. [83 MILLER,G. A. and J. C. R. LICKLIDER,The intelligibility of interrupted speech. J. Acoustical Society of America.Vol.22,1950,pp 167-173. [,〕 LICKLIDER.J. C. R. The effects of amplitude distortion upon the intelligibility of speech. J. Acoustical Society of America,Vol. 18.1946.pp 429-434. [103 WATHEN-DUNN. W. and D. W. LIPKE,On the power gained by clipping speech. J. Acoustical Society of America-V01. 30,1958.pp 36-40. [113 KNUDSEN.V().and C. M. HARRIS. Acoustical Designing in Architecture, chapter 9. New York,John Wiley and Sons,Inc. .1950. [123 PICKETT,J. M. Effect of vocal force on the intelligibility of speech. J. Acoustical Society of America.Vol.28,1956.pp 902-905. 仁1习 SUMBY, W. H. and 1. POLLACK, Visual contribution to speech intelligibility in noise. J. Acoustical Society of America.Vol.26,1954.pp 212-215 [143 LEVITT,H.and I.B. RABINER.Predicting binaural gain in intelligibility and release from masking for speech. J. Acoustical Society of America,Vol. 42.1967.pp 820-829. [15〕 张家绿,马大献,几种语言单位清晰度试验得分之间的统计关系,声学学报,卷1,No.2,1964, pp 90-94. [16〕 张家异,普通话可撇度(学位论文),1963. 附加说明: 本标准由全国声学标准化委员会提出。 本标准由中国科学院声学研究所负责起草。 本标准主要起草人张家绿、齐士铃. 1‘
本文档为【声学语言清晰度指数的计算方法】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_672142
暂无简介~
格式:pdf
大小:530KB
软件:PDF阅读器
页数:17
分类:金融/投资/证券
上传时间:2010-11-18
浏览量:160