首页 国内外英语配对（组）口试的信度与效度研究：现状、方法、问题与展望

国内外英语配对（组）口试的信度与效度研究：现状、方法、问题与展望

国内外英语配对（组）口试的信度与效度研究：现状、方法、问题与展望国内外英语配对（组）口试的信度与效度研究：现状、方法、问题与展望国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望第139期 2011年5月外语电化教学 CAFLE No.139 Mav2011 国内外英语配对(组)口试的信度与效度研究: 现状,方法,问题与展望楼荷英 (浙江大学外国语言文化与交流学院/浙江工业大学外国语学院,浙江杭州310058) 摘要:配对(组)口试即考生以配对(组)的形式就考试任务进行讨论,互动的第二语言13语测试.近十年来,英语配对(组)口语测...

国内外英语配对（组）口试的信度与效度研究：现状、方法、问题与展望国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望第139期 2011年5月外语电化教学 CAFLE No.139 Mav2011 国内外英语配对(组)口试的信度与效度研究: 现状,方法,问题与展望楼荷英 (浙江大学外国语言文化与交流学院/浙江工业大学外国语学院,浙江杭州310058) 摘要:配对(组)口试即考生以配对(组)的形式就考试任务进行讨论,互动的第二语言13语测试.近十年来,英语配对(组)口语测试形式因其任务的真实性,考试的实用性,实施的统一性以及对语言交际课堂教学的积极反拨等优势而被越来越多的大小型语言考试所采用.同时,因该口试自身固有的社会性特征,考试的信度与效度正日益受到关注.本文综述了配对(组)口语测试存在以来国内外就其信度,效度的研究, 分析研究的焦点及其存在的问题,并展望未来该领域研究的趋势. 关键词:配对(组)口语测试;信度研究;效度研究中图分类号:H319.3文献标识码:A文章编号:1001-5795(2011)03-0016-0006 口语测试是最直接反映考生语言交际能力的一种测试,属于做事测试,形式多样,主要分为半直接(考生根据要求录音,考官根据录音评分),直接(面试)两种.到目前为止,多数高风险考试以及其他口试最常用的是面试:一名考官面对一名考生的一对一形式 (1angnageproficiencyinterview,LPI),两名考官面对两名考生的配对形式(pairedformat)或两名考官面对两名以上考生的小组形式(groupformat).近十年来,受二语习得理论发展以及课堂教学实践理论影响,配对 (组)口语测试作为测试语言交际能力的最直接形式越来越被广泛采用.配对(组)口语测试中两名考官承担不同任务:一名考官按照考试要求向考生提问,引导考生完成考试任务并对照口试评分量表对考生的各项口语能力进行评估,另一名考官不参与提问,仅充当评分员,对照口试评分量表评估考生的各项口语能力. 国际着名的大型英语水平测试中雅思(IELTS)采用一对一形式,而剑桥第一证书(FCE)采用配对形式,我国的大学英语四六级口试(CET-SET)采用的是配组形式.因其使用的日益广泛性,配对(组)口语测试的信度与效度受到社会的极大关注. 配对(组)口语测试是考官和考生,考生和考生之间面对面交流的一种测试形式,融人了非考试状态下对话交际的元素,被认为是考生展示真实交际事件中的不同交际能力的考试(Brown,2003).与其他第二语言口语测试形式相比,此类口试具有以下优点:? 任务真实,形式多样.面试形式的口试中产生的话语真实性曾一度受到质疑(vanLier,1989;Lazaraton, 1996;Kormos,1999),而配对(组)口试的讨论完全模拟真实交际场景,考试设计目的就是让考生产生类似课堂讨论或真实交际的话语.任务类型可以根据构念的需要变化.?经济实用.可以安排两个或三个考生同时考试,考官无须接受专门的面试培训,大大节省了时间和成本,适用于报考人数多的大型口试.?评分公正.面试形式的口试考官就指南规定的主题直接与考生口语互动,通常考官所提问题无法预测,不同考官提问的问题难度与复杂度大相径庭,考官的行为严重影响考生成绩(Shohamy,1983;Bachman,1990; Stansfield,1991;McNamara,1996;Lazaraton,2002; Brown,2003).而配对(组)口试因主考官不参与讨论,提问的随机变化率小,又配有两名考官同时评分, 评分的统一性显着增加,评分更加公平.?反拨积极.配对或配组模拟课堂,真实交际环境中的讨论形作者简介:楼荷英:女,博士生,教授.研究方向:语言测试,二语习得. 收稿日期:2010-08.10 ? 16? 楼荷英:国内外英语配对(组)口试的信度与效度研究:现状,方法,问题与展望式将促使教师在组织教学过程中更多地采用对子或小组形式的交际活动,从而达到培养学生交际能力的真正目的.正是因为上述优点,配对(组)形式越来广泛地用到随堂口试和大规模第二语言口语水平测试中. 但同时研究者发现此类测试有双向互动(interaction) 的特性,而"双向互动"具有社会/行为学的意义即个体之间的共同行为构成共同表现的基础(McNamara, 1997:459).McNamara经典的试问是:这样的考试最后反映的成绩"到底是谁的成绩?"(McNamara,1997: 446).考官与考生,考生与考生之问的各方面表现相互影响,这种特定情景下的口试具有较强的社会性,考生不再是一个个孤立的个体,考试过程中的交际参与者已构成了"一个社会的世界",被试所得的考试分数并非就是其个人语言能力的反映,而是交际互动者共同构建的语言能力反映(jointconstructionofperform— ance).除考官和考生外,考试过程中还有诸多其他的因素对考生的表现起作用.此类口试的效度值得关注.事实上,上世纪90年代初配对(组)口试采用以来,语言测试界对其信度和效度的研究从未停止过. 1配对(组)口试研究的方法语言测试传统的研究范式主要是利用统计学方法进行考试信度,效度的实证研究,是基于心理测量的研究.到了现阶段,先进的统计学方法如多层面Rasch 模型,概化理论,结构方程模型等仍然是语言测试信度研究的主要方法,但已不是语言测试唯一的研究方法. 从上世纪80代末,90年代初始,测试研究尤其是口试研究范式发生了变化:McNamara提出了"语言测试研究不应局限于运用N个样本,通过先进的统计工具进行运算的定量分析方法,应该重视将考试作为一种社会行动研究"(McNamara,1997:460).Fulcher通过实践证明口试的构念效度可以通过话语分析来验证 (Fulcher,1987).Shohamy认为会话分析应是研究口语测试中互动本质的工具(Shohamy,1991).vanLier (1989)在研究中发现口语交际过程错综复杂,要考察语言学习者的口语交际表现必须从对话交际研究的过程着手,用微观分析的方法探索口语互动过程中产生的话语本质.Lazaraton(1991)在其博士论文中率先运用会话分析开展口试效度研究,获得了丰富的定量分析无法检测到的效度证据.之后,除信度研究仍采用先进的统计学方法外,配对(组)口试相关研究以定性方法为主.借鉴民族方法学的社会学研究方法,研究者首先将考试过程完整地录音录像,依据国际学术界公认的转写系统将口试参与者(考官,考生等)的会话完整地转写成文字,通过逐轮的(turn-by—turn)会话分析,探索会话互动中影响话语产出和口试成绩的因素. 2配对(组)口试研究的焦点配对(组)口试以对话互动为主要表现形式,其鲜明的社会性,成绩的共建性给评分的公正性带来了严重的威胁.配对或配组的互动交际形式使得考生的行为易于对他人的表现产生影响.因此,配对(组)口试研究主要就评分的公正性,双向互动过程中的对话者效应展开,运用模型对评分量表,考官评分严厉度,考试成绩进行分析,研究考试的信度;运用会话分析研究考官行为对考生表现的影响,考生作为对话者的特征与行为对同组其他考生的话语产出及其分数的影响, 多角度寻找效度依据.到目前为止,配对(组)口试研究已经从结合二语习得和话语分析理论研究发展到了跨多学科的多元研究. 2.1信度研究 "理想的信度在语言运用测试中意味着,考试结果尽可能少地受到考试实施中各个方面的影响,使报道的分数能够尽量接近考生在所测量的特定能力上的水平"(何莲珍等,2008:388).研究配对(组)口语考试的信度就是研究此类考试测量的误差,考试的解释性 (accountability).尽管面试形式的口试信度研究颇多 (Shohamy,1983;NevoandShohamy,1984;Bachman andSavignon,1986;Shohamyeta1.,1986;vanLier, 1989;Ross,1992;Stansfield&Kenyon,1992;Lazara— ton,1996a;McNamara&Lumley,1997),也有不少研究者研究基于任务的口语测试的信度,如任务难度,话题难度对考试信度的影响等(Fulcher,1996;Jennings, 1999;1washitaeta1.,2001;Elder,eta1.,2002;何莲珍等,2008),但配对(组)口语考试信度研究尚少,并且已有的研究发现有互相矛盾之处.有研究者一度否定配对(组)口试的信度,因为:?评分员培训难度大 (FollandandRobertson,1976:166;Hilsdon,1995: 193);?与面试,角色扮演相比,实施的可行性和评分的公平性没有优势,而测试考生的语言准确度方面劣势明显(NevoandShohamy,1984);Shohamyeta1.研究同,考生参与配对(组)口试获得的分数,面试,角色扮演和另一口头汇报任务获得的分数相关性,发现该考生配对(组)口试的分数与其他考试的分数相关程度低,证明它所测量的与其他考试不同(Shohamyet a1.,1986).然而,Fulcher(1996)研究发现相同考生 ? 17? 楼荷英:国内外英语配对(组)口试的信度与效度研究:现状,方法,问题与展望配组口试中所得分数与其在其他两个口语任务中所得分数有相似的解释性,任务的变化对全真分的影响不明显. 近年来,随着先进的统计软件的问世,研究者开始对配对(组)口试信度进行系统性的研究.Bonk& Ockey(2003)运用多层面Rasch模型通过将各层面的每一个体(考生,题目,评分员,评分标准和量表等)进行共同logit标尺上的度量,计算每个度量值的估算误差,对模型的拟合度,测算每个层面之间可能的交互作用,分析各层面对日本某大学编班EFL考试(EFL placementtest)成绩的影响,他们发现评分严厉度的明显差异,考试实施过程规范性的缺失等显着影响考生成绩,而任务,题目并不显着影响成绩,最后得出的结论是:配组口试适用于考生众多的大型口语考试,与信度较高的150题语法,阅读,词汇题组成的试卷相比, 它更符合二语口语水平的构念.何莲珍等(2008)运用多层面Rasch模型研究我国大学英语四,六级考试口语考试的信度,通过分析发现该考试"能够有效区分不同水平考生",考官评分严厉度差异显着,考官评分存在趋中现象.张文忠等(2008),金檀等(2008)曾运用模糊数学理论提出显着提高大规模口试评分信度的口语模糊评估方法,但目前尚处于理论研究阶段. 2.2效度研究语言测试理论经历了被称为"前科学测试阶段" (prescientificperiod),心理.结构测试阶段(psychomet. ric—structuralistperiod)之后,进入第三阶段,即社会语言测试阶段(sociolinguisticperiod).语言交际能力成为语言测试的主要构念.此时的语言测试由第二阶段的一味追求测试的信度转向信度与效度的综合考虑, 并逐渐将统一效度(Messick,1989)作为检验测试成功与否的目标,现代语言测试界越来越多地重视多维度的构念效度证据收集. 配对(组)口试考生成绩共同构建(coconstruction) 特性决定其交互主体性(intersubjectivity)的特征.考察此类考试的效度必须考察考生共同构建成绩的过程,否则无法获得丰富的效度证据.用语言测试界普遍采用的认知心理测量的视角已无济于事,语言测试界需要从崭新的视角着手,聚焦互动的社会维度,研究考试的效度(McNamara,1997:459).与社会学,社会心理学,社会语言学相结合的跨学科研究成为交际语言测试研究的必然. 国内外学者配对(组)口试效度研究主要通过会话分析(conversationalanalysis)开展.起初研究考试 ? 1R. 过程中的主考官效应(interlocutoreffect),如考官的行为与考生成绩之间的关系等(Lazaraton,1996a; 1996b;2002),之后逐渐转向考试实施过程中影响效度的多种因素研究,尤其是考生行为(candidatebehav— ior)的研究,如不同语言水平考生的配对(组)与考试过程中考生语言产出的关系(1washita,1998;Norton, 2005;Davis,2007,2009),配对考生之问的话语交际程度(He&Dai,2006),配对考生之间互动交际采用的话语策略以及互动交际的总体模式与口试得分之间的关系(Galaezi,2008). 受批判话语,话语心理学和女性话语分析等研究的影响,国外学者又从微观分析视角对口试交互交际中涉及的宏观社会范畴进行考察,试图研究考官和考生带人的各种不同身份对考试结果的影响,如配对考生之间的熟悉程度与考生语言交际水平的发挥 (0'Sullivan,2002),不同文化背景,不同性别和熟悉程度考生的配对与考试过程中语言产出的关系(No.on, 2005)等.但此类研究样本小而单一,基于大规模考试的样本分析缺乏,O'Sullivan和Norton的研究样本母语基本上是日语(O'Sullivan,2002;Norton,2005).从研究视角看,该类研究中最值得一提的是Lazaraton& Davis(2008)的剑桥FCE,PET口试效度研究.他们对口试过程进行全程录音录像,撰写口试考生问的会话细节,创造性地借鉴社会学,社会语言学关于身份的理论,将考生的语言水平设为口试环境下考生的主要身份,通过逐轮的会话分析考察配对(组)考生互动交际中语言水平身份(1anguageproficiencyidentity)的定位过程,展演方式以及语言水平身份变化与考生最后所得的口试分数之间的关系,初步证明考生带入某个考试任务的语言水平在配对互动交际过程中重新建构, 认同,展演;作为口试过程中考生的主要身份——语言水平是动态的,它基于配对对象的语言水平及其在互动中的发挥和激活程度而变化.Lazaraton&Davis的研究为语言测试的跨学科研究翻开了崭新的一页. 考生的性格特征对配对(组)成员得分的影响也偶有发表:Berry(2004)曾研究过配组考生的外向程度对考试成绩的影响,他运用EysenckPersonalityQues— tionnaire(EPQ)分数确定163名受试的性格特征(性格外向的为78人,性格内向的为85人),再将他们随机分成四人,五人或六人组,分配各组成员阅读一篇关于某研究的短文并与组员讨论该研究及其启发,规定讨论时间为每人5分钟.经过两位经验丰富的评分员打分和协方差计算(ANCOVA)显示:外向(n=78)和内问题与展望楼荷英:国内外英语配对(组)I:7试的信度与效度研究:现状,方法,向性格的(n=85)受试与平均外向程度高的配组时口试分数都比较高,而内向型受试与平均外向度低的配组后口试分数比预期的差.Ockey(2009)基于Berry 的研究,运用综合的人格调查问卷和更周密的配组方法,考察13本225名英语专业一年级学生的性格特征与口试分数的关系,结果发现:自信考生(assertivetest taker)的口试分数受其配组成员的自信程度影响,而不自信考生(non—assertivetesttaker)的口试分数与其配组成员的自信程度无关.总体来说,考生人格与分数之间的关系研究仍处于初级阶段,我们看到的只是对于个别文化群体的某个单一人格特征与口试成绩的局部关系,至今仍未有配组考生的多项人格特征与口试成绩关系的综合研究. 3配对(组)口试研究中存在的问题综上分析,自配对(组)口试实施以来,国内外对其信度与效度的研究已有了一定的成果,但因该口试类型实施时间短,研究成果有限,仍有许多问题没有明确的答案,研究仍有较大空间: (1)国内外尚缺乏以下领域的实证研究:基于足够大的数据库的评分员行为分析,评分的信度研究,不同题型影响考生成绩的程度和影响面等研究.目前已开展的研究多数是基于方便取样的原则上的,因此常常有样本单一,样本量小等弊病. (2)考试实施过程中多种因素对效度影响的综合研究仍为空白,效度证据收集有待更深入的跨学科合作,考生的人格,心理,性别等各类特征与分数的关系研究还需广泛深入. (3)各类信度,效度研究应基于国际范围更多的大规模高风险口试(operationalisedhigh—stakestest). 到目前为止,基于局部的分班考试,选拔考试的研究居多,基于大规模高风险口试的研究极其缺乏,研究者仅对剑桥第一证书口试进行了相关研究(Galaczi,2008; Lazaraton,2008),其他如我国的大学英语四六级口试,公共英语等级考试等的研究屈指可数(He&Dai, 2006;何莲珍等,2008). 4配对(组)口试研究的展望随着国内外升学,就业等领域对英语学习者语言综合能力要求的不断提高,口语能力的评价越来越普及.国际上大规模高风险的语言测试如TOFEL (iBT),IELTS,剑桥FCE等都在进行不断的口语测试形式,任务,评分,构念效度等方面的研究和探索.在国内,随着大学英语改革的进一步深入,英语口语教学与测试13益受到重视,口语测试的社会需求日益增加, 口试的效度势必也受到关注.根据我国国情,从考生基数,考官资源以及考试的效度考虑,已有学者开始研究计算机辅助口试的可行性(金艳等,2002;邱东林等,2005;蔡基刚,2005;高丙梁,2007;司耀龙,2008; 李玉平,2009;朱音尔等,2009;宫力等,2009).尽管在信息化时代,计算机辅助口试已成为研究的热点,但因口试本身的特殊性以及口语语料库开发,人机互动, 考试实施过程中技术保障等难题,具备良好的构念,信度和效度保证的计算机辅助口试还未成形.在今后很长一段时间,配对(组)口试将仍是国内外口语能力评价的主要形式,加上口试研究本身起步晚,该考试的研究仍有广阔的空间.具体来说,配对(组)口试今后的研究将呈以下趋势: (1)研究方法更加多元,跨学科研究进一步深入语言测试研究已从单一的心理测量演变到定量, 定性研究综合应用的时代,口语测试研究也已从单一的信度研究扩展到各层面的综合信度研究,再扩展到通过定性分析口试过程中考官,考生,考试环境,考试任务等因素对于考生表现的影响.在今后的研究中, 随着语言测试社会维度研究的高度重视,跨学科的口语测试社会性研究将成为焦点,研究者将测试学与社会学,社会心理学,社会语言学等学科结合,研究宏观和微观社会因素对考生表现,考生成绩的影响. (2)研究内容更加广泛在继续关注构念,评分标准及其实施,评分员评分公正性,考官在考试过程中的行为与考生表现的关系, 考试任务难度等问题的同时,考生在考试过程中的行为,如考生之间的交互过程,不同考生带人的不同身份在交互过程中的展现方式以及对配(对)组成员表现的影响等将受到重点关注.高风险考试的综合研究将进一步加强.我国的大学英语四六级口试也将成为研究焦点之一. (3)效度证据收集多维度考试效度不再是单一的统计学计算得出,而是通过多渠道收集证据,定性的考试过程分析(如会话分析)成为捕捉效度证据的重要手段.研究者还将试图从考生所得的最后分数追溯考官给分的依据,考生得分或失分的原因,分析考生已得的分数与微观会话分析所得的"拟合度",从而研究评分的合理性等,并且为教学提供积极的反拨.测试环境下的交互交际社会特征研究将对口语测试效度提供有力的理论支撑.此 . 19? 方法,问题与展望楼荷英:国内外英语配对(组)口试的信度与效度研究:现状,外,不同口试的各层面比较,尤其是与计算机辅助口试的比较也将成为效度研究的热点之一. 5结语[15] 口语测试领域的研究较其他测试研究起步晚,配对(组)口试研究更是个新领域.虽然通过国内外同f16] 行的不懈努力,该领域已有一定的成果,但研究的广度和深度还有较大的拓展空间.口参考文献 [1]Bachman,L.Fundamentalconsiderationsinlanguagetesting [M].Oxford:OxfordUniversityPress,1990. [2]Bachman,I.&Savignon,S.Theevaluationofcommunica. tivelanguageproficiency:acritiqueoftheACTFLoralinter— view[J].TheModernLanguageJournal,1986,70. [3]Berry,V.Astudyoftheinteractionbetweenindividualper— sonalitydifferencesandoralperformancetestfacets[D]. Unpublisheddoctoraldissertation.King'sCollege,University ofLondon,2004. [4]Bonk,W.J.&Ockey,G.J.Amany—facetanalysisofthe secondlanguagegrouporaldiscussiontask[J].Language Testing,2003,20. [5]Brown,A.Interviewervariationandtheco.constructionof speakingproficiency[J].LanguageTesting,2003,20(1). [6]Davis,L.Theinfluenceofpartnerproficiencyinapairedo— ralassessment[D].Unpublishedmaster'sthesis,University ofMinnesota,2007. [7]Davis,L.Thebffluenceofinterlocutorproficiencyina pairedoralassessment[J].LanguageTesting,2009,26. [8]Galaczi,E.D.Peer—peerinteractioninaspeakingtest:The caseoftheFirstCertificateinEnglishexamination[J].Lan— guageAssessmentQuarterly,2008,5. [9]Elder.C.,1washita,N.&McNamara,T.Estimatingthe difficultyoforalproficiencytasks:Whatdoesthetest—taker havetooffer[J].LanguageTesting,2002,19. [10]Folland,D.&Robertson,D.Towardsobjectivityingroup oraltesting[J].EnglishLanguageTeachingJournal,1976, 30. [11]Fulcher,G.Testsoforalperformance:Theneedfordata— basedcriteria[J].ELTJournal,1987,41. [12]Fulcher,G.Testingtasks:Issuesintaskdesignandthe grouporal[J].LanguageTesting,1996,13. [13JHe,L.,&Dai,Y.Acorpus—basedinvestigationintothe validityoftheCET—SETgroupdiscussion[J].Language Testing,2006,23. [14]Hilsdon,J.Thegrouporalexam:Advantagesandlimita . 20. [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] tions[A].InAlderson,J.&North,B.editors,Lanuage Testinginthe1990s:TheCommunicativeLegacy[C]. Hertfrodshire:PrenticeHallInternational.1995. 1washita,N.Thevalidityofthepairedinterviewformatin oralperformanceassessment[J].MelbournePapersofLan— guageTesting,1998,5(2). 1washita,N.McNamara,T.&Elder,C.Canwepredict taskdifficultyinanoralproficiencytest?Exploringthepo— tentialofaninformationprocessingapproachtotaskdesign [J].LanguageLearning,2001,21. Jennnings,M.Thetest—taker'schoice:Aninvestigationof theeffectoftopiconlanguagetestperformance[J].Lan— guageTesting,1999,16(4). Kormos,J.Simulatingconversationsinoral—proficiencyas— sessments:Aconversationanalysisofroleplaysandnon— scriptedinterviewsinlanguageexams[J].LanguageTes— ting,1999,16. Lazaraton,A.AConversationAnalysisofStructureandIn— teractionintheLanguageInterview[D].UnpublishedPh. DDissertation,UniversityofCaliforniaatLosAngeles, CA,1991. Lazaraton,A.AQualitativeApproachtoMonitoringExam— inerConductinCASE[M].Cambridge:CambridgeUniver— sityPress,1996a. Lazaraton,A.Interlocutorsupportinoralproficiencyinter- views:ThecaseofCASE[J].LanguageTesting,1996b, 13. Lazaraton,A.AQualitativeApproachtotheValidationof OralLanguageTests[M].Cambridge:CambridgeUniver- sityPress,2002. Lazaraton.A..&Davis.L.AMicroanalyticPerspective onDiscourse,Proficiency,andIdentityinPairedOralAs— sessment[J].LanguageAssessmentQuarterly,2008,5(4). McNanmra,T.F."Interaction"insecondlanguageper— formanceassessment:Whoseperformance[J].AppliedLin— guistics,1997,18. Manamara,T.F.&Lum|ey,T.Theeffectoftheinterloeu— torassessmentmodevariablesinoverseasassessmentsof speakingskillsinoccupationalsettings[J].LanguageTes— ting,1997,14(2). Messick,S.Validity[A].InR.L.Linn(Ed.),Educa— tionalMeasurement(3ed.)[C].NewYork:American CouncilonEducation&Mcmillan.1989. Nero,D.&Shohamy,E.Applingthejointcommittee'se. valuationstandardsflr0theassessmentofalternativetesting methods.PaperpresentedattheAnnualMeetingoftheA.. merieanEducationalResearchAssociation[R].NewOrle 楼荷英:国内外英语配对(组)1:7试的信度与效度研究:现状,方法,问题与展望 [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] ans,Louisiana,1984. No.on,J.Thepaired~nnatintheCambridgespeaking tests[J].ELTJournal,2005,59. Ockey,G.Theeffectsofgroupmembers'personalitiesona testtaker'sL2grouporaldiscussiontestscores[J].Lan— guageTesting,2009,26(2). O'Sullivan,B.Learneracquaintanceshipandoralproficien— cytestpair—taskperformance[J].LanguageTesting,2002, 19. Ross,S.Accomodativequestionsinoralproficiencyinter— views[J].LanguageTesting,1992,9. Shohamy,E.Thestabilityoforalproficiencyassessmenton theoralinterviewtestingprocedures[J].LanguageLearn— ing,1983,33. Shohamy,E.Discourseanalysisinlanguagetesting[J]. AnnualReviewofAppliedLinguistics,1991,11. Shohamy,E.,Reves,E.&Bejarano,Y.Introducinga newcomprehensivetestoforalproficiency[J].ELTJour- naZ,1986,40. Stansfield,C.Acomparativeanalysisofthesimulatedand directoralproficiencyinterviews[A].InAnivan,S.edi— tor,CurrentDevlopmentsinLanguageTesting[C].Singa— pore:Seameo,Relc,1991. Stansfield.C.W.&Kenyon.D.M.Researchonthecom— parabilityoftheoralproficiencyinterviewandthesimulated oralproficiencyinterview[J].System,1992.20. vanLier.Reeling,writhing,drawling,streching,andfaint一 [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] ingincoils.Oralproficiencyinterviewsasconversahon [J].TESOLQuarterly,1989,23. 蔡基刚.大学英语四,六级计算机口语测试效度,信度和可操作性研究[J].夕语界,2005(4):66—75 高丙梁.计算机口试与面试的比较研究[J].外语电化教学,2007(2). 官力,梁维谦,丁玉国.大规模英语口语考试跟读题型采用机器阅卷的可行性分析与实践研究[J].外语电化教学,2009(2). 何莲珍,张洁.多层面Rasch模型下大学英语四,六级考试口语考试(CET—SET)信度研究[J].现代外语,2008 (4). 金檀,王琰,宋春阳,等.口语模糊评分方法设计及实验研究[J].现代外语,2008(2). 金艳,郭杰克.大学英语四,六级非面试型口语考试效度研究[J].外语界,2002(5). 李玉平.大规模计算机辅助英语口语测试效果实证研究[J].外语界,2009(4). 邱东林,季佩英,万江波,等.大学英语听说机考尝试 [J],外语界,2005(4). 司耀龙.基于计算机的大规模商务英语口语诊断测试实践研究[J],外语电化教学,2008(1). 张文忠,张姬.(2008)基于模糊数学原理的口语测试模糊评估框架[J].外语教学与研究,2008(6). 朱音尔,张肖莹.基于网络的大学英语机考探索[J].外语电化教学,2009(2). ReliabilityandValidityStudyofthePairedOralTestsHomeandAbroad: StatusQUO,Methodology,ProblemsandProspects LOUHe—ying (SchoolofForeignStudies/Col1egeofForeignLanguages,ZhejiangUniVersity/ZhejiangU niversity ofTechnology,Hangzhou,Zhejiang310058,China) Abstract:ApairedoralEnglishtestisasecondlanguagespeakingtestwhichinvolvesdiscussi onandinteraction betweentwo(ormore)candidatesonanassignedtopic.Intherecentdecade,withitsauthentici ty,practicalityandunity ofadministration,thetestformathasbeenincreasinglypopular.Meanwhile,becauseoftheun iquecharacteristicsofthe test,itsreliabilityandvaliditybecometheresearchfocus.Thispaperreviewsandsummarizesthestudiesofreliability andvalidityonthepairedoraltestformathomeandabroadconcerningthestatusquo,themethodologyandproblems, andthenidentifiesthefutureresearchprospectsinthisarea. Keywords:Paired(Group)OralEnglishTest;Reliability;Validity ? 21?

                    本文档为【国内外英语配对（组）口试的信度与效度研究：现状、方法、问题与展望】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

国内外英语配对（组）口试的信度与效度研究：现状、方法、问题与展望

你可能还喜欢