首页 国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望

国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望

举报
开通vip

国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望 国内外英语配对(组)口试的信度与效度研 究:现状、方法、问题与展望 第139期 2011年5月 外语电化教学 CAFLE No.139 Mav2011 国内外英语配对(组)口试的信度与效度研究: 现状,方法,问题与展望 楼荷英 (浙江大学外国语言文化与交流学院/浙江工业大学外国语学院,浙江杭州310058) 摘要:配对(组)口试即考生以配对(组)的形式就考试任务进行讨论,互动的第二语言13语测 试.近十年来,英语配对(组)口语测...

国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望
国内外英语配对(组)口试的信度与效度研究:现状、 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 、问题与展望 国内外英语配对(组)口试的信度与效度研 究:现状、方法、问题与展望 第139期 2011年5月 外语电化教学 CAFLE No.139 Mav2011 国内外英语配对(组)口试的信度与效度研究: 现状,方法,问题与展望 楼荷英 (浙江大学外国语言文化与交流学院/浙江工业大学外国语学院,浙江杭州310058) 摘要:配对(组)口试即考生以配对(组)的形式就考试任务进行讨论,互动的第二语言13语测 试.近十年来,英语配对(组)口语测试形式因其任务的真实性,考试的实用性,实施的统一性以及对语 言交际课堂教学的积极反拨等优势而被越来越多的大小型语言考试所采用.同时,因该口试自身固有 的社会性特征,考试的信度与效度正日益受到关注.本文综述了配对(组)口语测试存在以来国内外就 其信度,效度的研究, 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 研究的焦点及其存在的问题,并展望未来该领域研究的趋势. 关键词:配对(组)口语测试;信度研究;效度研究 中图分类号:H319.3文献标识码:A文章编号:1001-5795(2011)03-0016-0006 口语测试是最直接反映考生语言交际能力的一种 测试,属于做事测试,形式多样,主要分为半直接(考生 根据要求录音,考官根据录音评分),直接(面试)两 种.到目前为止,多数高风险考试以及其他口试最常 用的是面试:一名考官面对一名考生的一对一形式 (1angnageproficiencyinterview,LPI),两名考官面对两 名考生的配对形式(pairedformat)或两名考官面对两 名以上考生的小组形式(groupformat).近十年来,受 二语习得理论发展以及课堂教学实践理论影响,配对 (组)口语测试作为测试语言交际能力的最直接形式 越来越被广泛采用.配对(组)口语测试中两名考官 承担不同任务:一名考官按照考试要求向考生提问,引 导考生完成考试任务并对照口试评分量表对考生的各 项口语能力进行评估,另一名考官不参与提问,仅充当 评分员,对照口试评分量表评估考生的各项口语能力. 国际着名的大型英语水平测试中雅思(IELTS)采用一 对一形式,而剑桥第一证书(FCE)采用配对形式,我国 的大学英语四六级口试(CET-SET)采用的是配组形 式.因其使用的日益广泛性,配对(组)口语测试的信 度与效度受到社会的极大关注. 配对(组)口语测试是考官和考生,考生和考生之 间面对面交流的一种测试形式,融人了非考试状态下 对话交际的元素,被认为是考生展示真实交际事件中 的不同交际能力的考试(Brown,2003).与其他第二 语言口语测试形式相比,此类口试具有以下优点:? 任务真实,形式多样.面试形式的口试中产生的话语 真实性曾一度受到质疑(vanLier,1989;Lazaraton, 1996;Kormos,1999),而配对(组)口试的讨论完全模 拟真实交际场景,考试 设计 领导形象设计圆作业设计ao工艺污水处理厂设计附属工程施工组织设计清扫机器人结构设计 目的就是让考生产生类似 课堂讨论或真实交际的话语.任务类型可以根据构念 的需要变化.?经济实用.可以安排两个或三个考 生同时考试,考官无须接受专门的面试培训,大大节省 了时间和成本,适用于报考人数多的大型口试.?评 分公正.面试形式的口试考官就指南规定的主题直接 与考生口语互动,通常考官所提问题无法预测,不同考 官提问的问题难度与复杂度大相径庭,考官的行为严 重影响考生成绩(Shohamy,1983;Bachman,1990; Stansfield,1991;McNamara,1996;Lazaraton,2002; Brown,2003).而配对(组)口试因主考官不参与讨 论,提问的随机变化率小,又配有两名考官同时评分, 评分的统一性显着增加,评分更加公平.?反拨积 极.配对或配组模拟课堂,真实交际环境中的讨论形 作者简介:楼荷英:女,博士生,教授.研究方向:语言测试,二语习得. 收稿日期:2010-08.10 ? 16? 楼荷英:国内外英语配对(组)口试的信度与效度研究:现状,方法,问题与展望 式将促使教师在组织教学过程中更多地采用对子或小 组形式的交际活动,从而达到培养学生交际能力的真 正目的.正是因为上述优点,配对(组)形式越来广泛 地用到随堂口试和大规模第二语言口语水平测试中. 但同时研究者发现此类测试有双向互动(interaction) 的特性,而"双向互动"具有社会/行为学的意义即个 体之间的共同行为构成共同表现的基础(McNamara, 1997:459).McNamara经典的试问是:这样的考试最 后反映的成绩"到底是谁的成绩?"(McNamara,1997: 446).考官与考生,考生与考生之问的各方面表现相 互影响,这种特定情景下的口试具有较强的社会性,考 生不再是一个个孤立的个体,考试过程中的交际参与 者已构成了"一个社会的世界",被试所得的考试分数 并非就是其个人语言能力的反映,而是交际互动者共 同构建的语言能力反映(jointconstructionofperform— ance).除考官和考生外,考试过程中还有诸多其他的 因素对考生的表现起作用.此类口试的效度值得关 注.事实上,上世纪90年代初配对(组)口试采用以 来,语言测试界对其信度和效度的研究从未停止过. 1配对(组)口试研究的方法 语言测试传统的研究范式主要是利用统计学方法 进行考试信度,效度的实证研究,是基于心理测量的研 究.到了现阶段,先进的统计学方法如多层面Rasch 模型,概化理论,结构方程模型等仍然是语言测试信度 研究的主要方法,但已不是语言测试唯一的研究方法. 从上世纪80代末,90年代初始,测试研究尤其是口试 研究范式发生了变化:McNamara提出了"语言测试研 究不应局限于运用N个样本,通过先进的统计工具进 行运算的定量分析方法,应该重视将考试作为一种社 会行动研究"(McNamara,1997:460).Fulcher通过实 践证明口试的构念效度可以通过话语分析来验证 (Fulcher,1987).Shohamy认为会话分析应是研究口 语测试中互动本质的工具(Shohamy,1991).vanLier (1989)在研究中发现口语交际过程错综复杂,要考察 语言学习者的口语交际表现必须从对话交际研究的过 程着手,用微观分析的方法探索口语互动过程中产生 的话语本质.Lazaraton(1991)在其博士论文中率先运 用会话分析开展口试效度研究,获得了丰富的定量分 析无法检测到的效度证据.之后,除信度研究仍采用 先进的统计学方法外,配对(组)口试相关研究以定性 方法为主.借鉴民族方法学的社会学研究方法,研究 者首先将考试过程完整地录音录像,依据国际学术界 公认的转写系统将口试参与者(考官,考生等)的会话 完整地转写成文字,通过逐轮的(turn-by—turn)会话分 析,探索会话互动中影响话语产出和口试成绩的因素. 2配对(组)口试研究的焦点 配对(组)口试以对话互动为主要表现形式,其鲜 明的社会性,成绩的共建性给评分的公正性带来了严 重的威胁.配对或配组的互动交际形式使得考生的行 为易于对他人的表现产生影响.因此,配对(组)口试 研究主要就评分的公正性,双向互动过程中的对话者 效应展开,运用模型对评分量表,考官评分严厉度,考 试成绩进行分析,研究考试的信度;运用会话分析研究 考官行为对考生表现的影响,考生作为对话者的特征 与行为对同组其他考生的话语产出及其分数的影响, 多角度寻找效度依据.到目前为止,配对(组)口试研 究已经从结合二语习得和话语分析理论研究发展到了 跨多学科的多元研究. 2.1信度研究 "理想的信度在语言运用测试中意味着,考试结果 尽可能少地受到考试实施中各个方面的影响,使报道 的分数能够尽量接近考生在所测量的特定能力上的水 平"(何莲珍等,2008:388).研究配对(组)口语考试 的信度就是研究此类考试测量的误差,考试的解释性 (accountability).尽管面试形式的口试信度研究颇多 (Shohamy,1983;NevoandShohamy,1984;Bachman andSavignon,1986;Shohamyeta1.,1986;vanLier, 1989;Ross,1992;Stansfield&Kenyon,1992;Lazara— ton,1996a;McNamara&Lumley,1997),也有不少研 究者研究基于任务的口语测试的信度,如任务难度,话 题难度对考试信度的影响等(Fulcher,1996;Jennings, 1999;1washitaeta1.,2001;Elder,eta1.,2002;何莲珍 等,2008),但配对(组)口语考试信度研究尚少,并且 已有的研究发现有互相矛盾之处.有研究者一度否定 配对(组)口试的信度,因为:?评分员培训难度大 (FollandandRobertson,1976:166;Hilsdon,1995: 193);?与面试,角色扮演相比,实施的可行性和评分 的公平性没有优势,而测试考生的语言准确度方面劣 势明显(NevoandShohamy,1984);Shohamyeta1.研究 同,考生参与配对(组)口试获得的分数,面试,角色 扮演和另一口头汇报任务获得的分数相关性,发现该 考生配对(组)口试的分数与其他考试的分数相关程 度低,证明它所测量的与其他考试不同(Shohamyet a1.,1986).然而,Fulcher(1996)研究发现相同考生 ? 17? 楼荷英:国内外英语配对(组)口试的信度与效度研究:现状,方法,问题与展望 配组口试中所得分数与其在其他两个口语任务中所得 分数有相似的解释性,任务的变化对全真分的影响不 明显. 近年来,随着先进的统计软件的问世,研究者开始 对配对(组)口试信度进行系统性的研究.Bonk& Ockey(2003)运用多层面Rasch模型通过将各层面的 每一个体(考生,题目,评分员,评分 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 和量表等)进 行共同logit标尺上的度量,计算每个度量值的估算误 差,对模型的拟合度,测算每个层面之间可能的交互作 用,分析各层面对日本某大学编班EFL考试(EFL placementtest)成绩的影响,他们发现评分严厉度的明 显差异,考试实施过程规范性的缺失等显着影响考生 成绩,而任务,题目并不显着影响成绩,最后得出的结 论是:配组口试适用于考生众多的大型口语考试,与信 度较高的150题语法,阅读,词汇题组成的试卷相比, 它更符合二语口语水平的构念.何莲珍等(2008)运 用多层面Rasch模型研究我国大学英语四,六级考试 口语考试的信度,通过分析发现该考试"能够有效区分 不同水平考生",考官评分严厉度差异显着,考官评分 存在趋中现象.张文忠等(2008),金檀等(2008)曾运 用模糊数学理论提出显着提高大规模口试评分信度的 口语模糊评估方法,但目前尚处于理论研究阶段. 2.2效度研究 语言测试理论经历了被称为"前科学测试阶段" (prescientificperiod),心理.结构测试阶段(psychomet. ric—structuralistperiod)之后,进入第三阶段,即社会语 言测试阶段(sociolinguisticperiod).语言交际能力成 为语言测试的主要构念.此时的语言测试由第二阶段 的一味追求测试的信度转向信度与效度的综合考虑, 并逐渐将统一效度(Messick,1989)作为检验测试成功 与否的目标,现代语言测试界越来越多地重视多维度 的构念效度证据收集. 配对(组)口试考生成绩共同构建(coconstruction) 特性决定其交互主体性(intersubjectivity)的特征.考 察此类考试的效度必须考察考生共同构建成绩的过 程,否则无法获得丰富的效度证据.用语言测试界普 遍采用的认知心理测量的视角已无济于事,语言测试 界需要从崭新的视角着手,聚焦互动的社会维度,研究 考试的效度(McNamara,1997:459).与社会学,社会 心理学,社会语言学相结合的跨学科研究成为交际语 言测试研究的必然. 国内外学者配对(组)口试效度研究主要通过会 话分析(conversationalanalysis)开展.起初研究考试 ? 1R. 过程中的主考官效应(interlocutoreffect),如考官的行 为与考生成绩之间的关系等(Lazaraton,1996a; 1996b;2002),之后逐渐转向考试实施过程中影响效度 的多种因素研究,尤其是考生行为(candidatebehav— ior)的研究,如不同语言水平考生的配对(组)与考试 过程中考生语言产出的关系(1washita,1998;Norton, 2005;Davis,2007,2009),配对考生之问的话语交际程 度(He&Dai,2006),配对考生之间互动交际采用的 话语策略以及互动交际的总体模式与口试得分之间的 关系(Galaezi,2008). 受批判话语,话语心理学和女性话语分析等研究 的影响,国外学者又从微观分析视角对口试交互交际 中涉及的宏观社会范畴进行考察,试图研究考官和考 生带人的各种不同身份对考试结果的影响,如配对考 生之间的熟悉程度与考生语言交际水平的发挥 (0'Sullivan,2002),不同文化背景,不同性别和熟悉程 度考生的配对与考试过程中语言产出的关系(No.on, 2005)等.但此类研究样本小而单一,基于大规模考试 的样本分析缺乏,O'Sullivan和Norton的研究样本母语 基本上是日语(O'Sullivan,2002;Norton,2005).从研 究视角看,该类研究中最值得一提的是Lazaraton& Davis(2008)的剑桥FCE,PET口试效度研究.他们对 口试过程进行全程录音录像,撰写口试考生问的会话 细节,创造性地借鉴社会学,社会语言学关于身份的理 论,将考生的语言水平设为口试环境下考生的主要身 份,通过逐轮的会话分析考察配对(组)考生互动交际 中语言水平身份(1anguageproficiencyidentity)的定位 过程,展演方式以及语言水平身份变化与考生最后所 得的口试分数之间的关系,初步证明考生带入某个考 试任务的语言水平在配对互动交际过程中重新建构, 认同,展演;作为口试过程中考生的主要身份——语言 水平是动态的,它基于配对对象的语言水平及其在互 动中的发挥和激活程度而变化.Lazaraton&Davis的 研究为语言测试的跨学科研究翻开了崭新的一页. 考生的性格特征对配对(组)成员得分的影响也 偶有发表:Berry(2004)曾研究过配组考生的外向程度 对考试成绩的影响,他运用EysenckPersonalityQues— tionnaire(EPQ)分数确定163名受试的性格特征(性格 外向的为78人,性格内向的为85人),再将他们随机 分成四人,五人或六人组,分配各组成员阅读一篇关于 某研究的短文并与组员讨论该研究及其启发,规定讨 论时间为每人5分钟.经过两位经验丰富的评分员打 分和协方差计算(ANCOVA)显示:外向(n=78)和内 问题与展望 楼荷英:国内外英语配对(组)I:7试的信度与效度研究:现状,方法,向性格的(n=85)受试与平均外向程度高的配组时口 试分数都比较高,而内向型受试与平均外向度低的配 组后口试分数比预期的差.Ockey(2009)基于Berry 的研究,运用综合的人格调查问卷和更周密的配组方 法,考察13本225名英语专业一年级学生的性格特征 与口试分数的关系,结果发现:自信考生(assertivetest taker)的口试分数受其配组成员的自信程度影响,而不 自信考生(non—assertivetesttaker)的口试分数与其配 组成员的自信程度无关.总体来说,考生人格与分数 之间的关系研究仍处于初级阶段,我们看到的只是对 于个别文化群体的某个单一人格特征与口试成绩的局 部关系,至今仍未有配组考生的多项人格特征与口试 成绩关系的综合研究. 3配对(组)口试研究中存在的问题 综上分析,自配对(组)口试实施以来,国内外对 其信度与效度的研究已有了一定的成果,但因该口试 类型实施时间短,研究成果有限,仍有许多问题没有明 确的答案,研究仍有较大空间: (1)国内外尚缺乏以下领域的实证研究:基于足 够大的数据库的评分员行为分析,评分的信度研究,不 同题型影响考生成绩的程度和影响面等研究.目前已 开展的研究多数是基于方便取样的原则上的,因此常 常有样本单一,样本量小等弊病. (2)考试实施过程中多种因素对效度影响的综合 研究仍为空白,效度证据收集有待更深入的跨学科合 作,考生的人格,心理,性别等各类特征与分数的关系 研究还需广泛深入. (3)各类信度,效度研究应基于国际范围更多的 大规模高风险口试(operationalisedhigh—stakestest). 到目前为止,基于局部的分班考试,选拔考试的研究居 多,基于大规模高风险口试的研究极其缺乏,研究者仅 对剑桥第一证书口试进行了相关研究(Galaczi,2008; Lazaraton,2008),其他如我国的大学英语四六级口 试,公共英语等级考试等的研究屈指可数(He&Dai, 2006;何莲珍等,2008). 4配对(组)口试研究的展望 随着国内外升学,就业等领域对英语学习者语言 综合能力要求的不断提高,口语能力的评价越来越普 及.国际上大规模高风险的语言测试如TOFEL (iBT),IELTS,剑桥FCE等都在进行不断的口语测试 形式,任务,评分,构念效度等方面的研究和探索.在 国内,随着大学英语改革的进一步深入,英语口语教学 与测试13益受到重视,口语测试的社会需求日益增加, 口试的效度势必也受到关注.根据我国国情,从考生 基数,考官资源以及考试的效度考虑,已有学者开始研 究计算机辅助口试的可行性(金艳等,2002;邱东林 等,2005;蔡基刚,2005;高丙梁,2007;司耀龙,2008; 李玉平,2009;朱音尔等,2009;宫力等,2009).尽管 在信息化时代,计算机辅助口试已成为研究的热点,但 因口试本身的特殊性以及口语语料库开发,人机互动, 考试实施过程中技术保障等难题,具备良好的构念,信 度和效度保证的计算机辅助口试还未成形.在今后很 长一段时间,配对(组)口试将仍是国内外口语能力评 价的主要形式,加上口试研究本身起步晚,该考试的研 究仍有广阔的空间.具体来说,配对(组)口试今后的 研究将呈以下趋势: (1)研究方法更加多元,跨学科研究进一步深入 语言测试研究已从单一的心理测量演变到定量, 定性研究综合应用的时代,口语测试研究也已从单一 的信度研究扩展到各层面的综合信度研究,再扩展到 通过定性分析口试过程中考官,考生,考试环境,考试 任务等因素对于考生表现的影响.在今后的研究中, 随着语言测试社会维度研究的高度重视,跨学科的口 语测试社会性研究将成为焦点,研究者将测试学与社 会学,社会心理学,社会语言学等学科结合,研究宏观 和微观社会因素对考生表现,考生成绩的影响. (2)研究 内容 财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容 更加广泛 在继续关注构念,评分标准及其实施,评分员评分 公正性,考官在考试过程中的行为与考生表现的关系, 考试任务难度等问题的同时,考生在考试过程中的行 为,如考生之间的交互过程,不同考生带人的不同身份 在交互过程中的展现方式以及对配(对)组成员表现 的影响等将受到重点关注.高风险考试的综合研究将 进一步加强.我国的大学英语四六级口试也将成为研 究焦点之一. (3)效度证据收集多维度 考试效度不再是单一的统计学计算得出,而是通 过多渠道收集证据,定性的考试过程分析(如会话分 析)成为捕捉效度证据的重要手段.研究者还将试图 从考生所得的最后分数追溯考官给分的依据,考生得 分或失分的原因,分析考生已得的分数与微观会话分 析所得的"拟合度",从而研究评分的合理性等,并且 为教学提供积极的反拨.测试环境下的交互交际社会 特征研究将对口语测试效度提供有力的理论支撑.此 . 19? 方法,问题与展望 楼荷英:国内外英语配对(组)口试的信度与效度研究:现状,外,不同口试的各层面比较,尤其是与计算机辅助口试 的比较也将成为效度研究的热点之一. 5结语[15] 口语测试领域的研究较其他测试研究起步晚,配 对(组)口试研究更是个新领域.虽然通过国内外同f16] 行的不懈努力,该领域已有一定的成果,但研究的广度 和深度还有较大的拓展空间.口 参考文献 [1]Bachman,L.Fundamentalconsiderationsinlanguagetesting [M].Oxford:OxfordUniversityPress,1990. [2]Bachman,I.&Savignon,S.Theevaluationofcommunica. tivelanguageproficiency:acritiqueoftheACTFLoralinter— view[J].TheModernLanguageJournal,1986,70. [3]Berry,V.Astudyoftheinteractionbetweenindividualper— sonalitydifferencesandoralperformancetestfacets[D]. Unpublisheddoctoraldissertation.King'sCollege,University ofLondon,2004. [4]Bonk,W.J.&Ockey,G.J.Amany—facetanalysisofthe secondlanguagegrouporaldiscussiontask[J].Language Testing,2003,20. [5]Brown,A.Interviewervariationandtheco.constructionof speakingproficiency[J].LanguageTesting,2003,20(1). [6]Davis,L.Theinfluenceofpartnerproficiencyinapairedo— ralassessment[D].Unpublishedmaster'sthesis,University ofMinnesota,2007. [7]Davis,L.Thebffluenceofinterlocutorproficiencyina pairedoralassessment[J].LanguageTesting,2009,26. [8]Galaczi,E.D.Peer—peerinteractioninaspeakingtest:The caseoftheFirstCertificateinEnglishexamination[J].Lan— guageAssessmentQuarterly,2008,5. [9]Elder.C.,1washita,N.&McNamara,T.Estimatingthe difficultyoforalproficiencytasks:Whatdoesthetest—taker havetooffer[J].LanguageTesting,2002,19. [10]Folland,D.&Robertson,D.Towardsobjectivityingroup oraltesting[J].EnglishLanguageTeachingJournal,1976, 30. [11]Fulcher,G.Testsoforalperformance:Theneedfordata— basedcriteria[J].ELTJournal,1987,41. [12]Fulcher,G.Testingtasks:Issuesintaskdesignandthe grouporal[J].LanguageTesting,1996,13. [13JHe,L.,&Dai,Y.Acorpus—basedinvestigationintothe validityoftheCET—SETgroupdiscussion[J].Language Testing,2006,23. [14]Hilsdon,J.Thegrouporalexam:Advantagesandlimita . 20. [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] tions[A].InAlderson,J.&North,B.editors,Lanuage Testinginthe1990s:TheCommunicativeLegacy[C]. Hertfrodshire:PrenticeHallInternational.1995. 1washita,N.Thevalidityofthepairedinterviewformatin oralperformanceassessment[J].MelbournePapersofLan— guageTesting,1998,5(2). 1washita,N.McNamara,T.&Elder,C.Canwepredict taskdifficultyinanoralproficiencytest?Exploringthepo— tentialofaninformationprocessingapproachtotaskdesign [J].LanguageLearning,2001,21. Jennnings,M.Thetest—taker'schoice:Aninvestigationof theeffectoftopiconlanguagetestperformance[J].Lan— guageTesting,1999,16(4). Kormos,J.Simulatingconversationsinoral—proficiencyas— sessments:Aconversationanalysisofroleplaysandnon— scriptedinterviewsinlanguageexams[J].LanguageTes— ting,1999,16. Lazaraton,A.AConversationAnalysisofStructureandIn— teractionintheLanguageInterview[D].UnpublishedPh. DDissertation,UniversityofCaliforniaatLosAngeles, CA,1991. Lazaraton,A.AQualitativeApproachtoMonitoringExam— inerConductinCASE[M].Cambridge:CambridgeUniver— sityPress,1996a. Lazaraton,A.Interlocutorsupportinoralproficiencyinter- views:ThecaseofCASE[J].LanguageTesting,1996b, 13. Lazaraton,A.AQualitativeApproachtotheValidationof OralLanguageTests[M].Cambridge:CambridgeUniver- sityPress,2002. Lazaraton.A..&Davis.L.AMicroanalyticPerspective onDiscourse,Proficiency,andIdentityinPairedOralAs— sessment[J].LanguageAssessmentQuarterly,2008,5(4). McNanmra,T.F."Interaction"insecondlanguageper— formanceassessment:Whoseperformance[J].AppliedLin— guistics,1997,18. Manamara,T.F.&Lum|ey,T.Theeffectoftheinterloeu— torassessmentmodevariablesinoverseasassessmentsof speakingskillsinoccupationalsettings[J].LanguageTes— ting,1997,14(2). Messick,S.Validity[A].InR.L.Linn(Ed.),Educa— tionalMeasurement(3ed.)[C].NewYork:American CouncilonEducation&Mcmillan.1989. Nero,D.&Shohamy,E.Applingthejointcommittee'se. valuationstandardsflr0theassessmentofalternativetesting methods.PaperpresentedattheAnnualMeetingoftheA.. merieanEducationalResearchAssociation[R].NewOrle 楼荷英:国内外英语配对(组)1:7试的信度与效度研究:现状,方法,问题与展望 [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] ans,Louisiana,1984. No.on,J.Thepaired~nnatintheCambridgespeaking tests[J].ELTJournal,2005,59. Ockey,G.Theeffectsofgroupmembers'personalitiesona testtaker'sL2grouporaldiscussiontestscores[J].Lan— guageTesting,2009,26(2). O'Sullivan,B.Learneracquaintanceshipandoralproficien— cytestpair—taskperformance[J].LanguageTesting,2002, 19. Ross,S.Accomodativequestionsinoralproficiencyinter— views[J].LanguageTesting,1992,9. Shohamy,E.Thestabilityoforalproficiencyassessmenton theoralinterviewtestingprocedures[J].LanguageLearn— ing,1983,33. Shohamy,E.Discourseanalysisinlanguagetesting[J]. AnnualReviewofAppliedLinguistics,1991,11. Shohamy,E.,Reves,E.&Bejarano,Y.Introducinga newcomprehensivetestoforalproficiency[J].ELTJour- naZ,1986,40. Stansfield,C.Acomparativeanalysisofthesimulatedand directoralproficiencyinterviews[A].InAnivan,S.edi— tor,CurrentDevlopmentsinLanguageTesting[C].Singa— pore:Seameo,Relc,1991. Stansfield.C.W.&Kenyon.D.M.Researchonthecom— parabilityoftheoralproficiencyinterviewandthesimulated oralproficiencyinterview[J].System,1992.20. vanLier.Reeling,writhing,drawling,streching,andfaint一 [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] ingincoils.Oralproficiencyinterviewsasconversahon [J].TESOLQuarterly,1989,23. 蔡基刚.大学英语四,六级计算机口语测试效度,信度和 可操作性研究[J].夕语界,2005(4):66—75 高丙梁.计算机口试与面试的比较研究[J].外语电化 教学,2007(2). 官力,梁维谦,丁玉国.大规模英语口语考试跟读题型采 用机器阅卷的可行性分析与实践研究[J].外语电化教 学,2009(2). 何莲珍,张洁.多层面Rasch模型下大学英语四,六级考 试口语考试(CET—SET)信度研究[J].现代外语,2008 (4). 金檀,王琰,宋春阳,等.口语模糊评分方法设计及实验 研究[J].现代外语,2008(2). 金艳,郭杰克.大学英语四,六级非面试型口语考试效度 研究[J].外语界,2002(5). 李玉平.大规模计算机辅助英语口语测试效果实证研 究[J].外语界,2009(4). 邱东林,季佩英,万江波,等.大学英语听说机考尝试 [J],外语界,2005(4). 司耀龙.基于计算机的大规模商务英语口语诊断测试实 践研究[J],外语电化教学,2008(1). 张文忠,张姬.(2008)基于模糊数学原理的口语测试模 糊评估框架[J].外语教学与研究,2008(6). 朱音尔,张肖莹.基于网络的大学英语机考探索[J].外 语电化教学,2009(2). ReliabilityandValidityStudyofthePairedOralTestsHomeandAbroad: StatusQUO,Methodology,ProblemsandProspects LOUHe—ying (SchoolofForeignStudies/Col1egeofForeignLanguages,ZhejiangUniVersity/ZhejiangU niversity ofTechnology,Hangzhou,Zhejiang310058,China) Abstract:ApairedoralEnglishtestisasecondlanguagespeakingtestwhichinvolvesdiscussi onandinteraction betweentwo(ormore)candidatesonanassignedtopic.Intherecentdecade,withitsauthentici ty,practicalityandunity ofadministration,thetestformathasbeenincreasinglypopular.Meanwhile,becauseoftheun iquecharacteristicsofthe test,itsreliabilityandvaliditybecometheresearchfocus.Thispaperreviewsandsummarizesthestudiesofreliability andvalidityonthepairedoraltestformathomeandabroadconcerningthestatusquo,themethodologyandproblems, andthenidentifiesthefutureresearchprospectsinthisarea. Keywords:Paired(Group)OralEnglishTest;Reliability;Validity ? 21?
本文档为【国内外英语配对(组)口试的信度与效度研究:现状、方法、问题与展望】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_260251
暂无简介~
格式:doc
大小:47KB
软件:Word
页数:19
分类:
上传时间:2018-12-14
浏览量:31