首页 (精心整理)WordSmith使用介绍

(精心整理)WordSmith使用介绍

举报
开通vip

(精心整理)WordSmith使用介绍1.WordSmith介绍这是WordSmith工具控制器的主画面.它有四个主要的菜单选项,一个谚语(不断变化,您可以编辑),主要工具的三个按钮(Concord是红色,因为这个工具在使用中),以及一系列的标签.目前,我们看到它显示anthony&cleopatra.txt已被选定用做Concord.2.选择文本文件要选择文本文件,单击主控制器中的文件菜单:当你单击选择文本,你会看到像这样:在左边是一个相当标准的文本文件资源管理器中,右边是一个选中文本区域.按一下有两个蓝色箭头的按钮(如下图光标处),或拖曳一些文本文...

(精心整理)WordSmith使用介绍
1.WordSmith介绍这是WordSmith工具控制器的主画面.它有四个主要的菜单选项,一个谚语(不断变化,您可以编辑),主要工具的三个按钮(Concord是红色,因为这个工具在使用中),以及一系列的标签.目前,我们看到它显示anthony&cleopatra.txt已被选定用做Concord.2.选择文本文件要选择文本文件,单击主控制器中的文件菜单:当你单击选择文本,你会看到像这样:在左边是一个相当 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 的文本文件资源管理器中,右边是一个选中文本区域.按一下有两个蓝色箭头的按钮(如下图光标处),或拖曳一些文本文件从左至右。您应该会看到类似这样:目前WordSmith表明(在上图状态栏)7个已被保存.您可以看到文件大小,但WordSmith(还)不知道每个文本文件有多少的词.我们选择了Concord的7个文本(见Concord上位于已选文件).按下绿色按钮或者关闭窗口.3.Concord3.1Concord概况Aconcordance看起来就像这样:它是所有出现wherefore在RomeoandJuliet的8个文本的concordance.目前只有3项.第一个有644个词(43%),其源文件是rom06.txt.3.2制作一个Concordance当您按下主控制器Concord按钮,一个新的Concord工具打开了并出现在Windows任务栏.现在在Concord,选择File|New.如果没有文本文件已选定,会要求您选择一些.按ChooseTextsNow按钮.一旦文本被选中,输入一个合适的SearchWord:在这里,已经选择wherefore作为搜索词.然后按OK.concordance列出所有"wherefore"的例子,还在词前后有一个词分隔符号,如标点符号,空格等.既然现在我们已经做了concordance,WordSmith现在知道每一个文本文件有多少词:rom06.txt共有1,506次;rom8.txt更大(2,236个单词).3.3查看源文件要查看源文件,双击正使用的线.在这里,点击了突出行包含有whereforeartthouRomeo.或按F8,线会变粗:或把有兴趣d的线拉长或拉粗:将光标放在左栏的2和3数目之间,它改变形状:再拉下来.也可以把光标放在右边缘后再拉粗,就在Set的左边.3.4Collocates和MutualInformation以下是AGO的collocates,用BNC的 关于书的成语关于读书的排比句社区图书漂流公约怎么写关于读书的小报汉书pdf 面部分计算所得,按频率排序.有AGO的实例近17000个,并且 YEARS 是首位搭配,9000次邻现于 AGO."关系"栏为空,此时只能用频率对每栏进行排序,或按照词的字母顺序排序.所需的是要知道所有这些collocates,每个与AGO 关系有多紧密.是否 A,THE,WAS 等等,真的与 AGO关系紧密? 如果我们现在选择菜单 计算|MutualInformation,  并选择一个合适的词表来做比较:  那么,我们得到以下列表,排序时按 关系 栏:  列表前面几项能更好地反映AGO随着时间和数量的趋势.[首位搭配(HENSLEY)只有5次同现于 AGO (BNC书面部分共有17次).]3.5使用标注Concordancing如果您的源文件有标注,可要做的第一件事是让WordSmith知道.要做到这一点,在主 控制器(​http:​/​​/​www.lexically.net​/​wordsmith​/​step_by_step_chinese​/​introduction.htm​),选 Settings|AdjustSettings            然后,选 TagsandMark-up.          如果您使用的是英国国家语料库,在 Customsettings里选它,如上所示.然后选Entityfile如果不想见eacute; 不选 é 及类似的,再按 Load:     .     到目前为止,我们已告诉控制器,忽略以尖括号开始和结束的所有标签(<>),把几个实体引用 翻译 阿房宫赋翻译下载德汉翻译pdf阿房宫赋翻译下载阿房宫赋翻译下载翻译理论.doc 成符号,如 % 和 ", 并且删除了每个文本的题头(直到 ).作为一个开端,已经不错了. 现在,我们对词类做concordance.BNC使用的标记,如下所示::     atthegreathouses     所以每个介词标记为  在介词本身前.目的是要看到在BNC选定的文字的所有的介词.选定一个BNC文本文件后,键入 *作为搜索词(星号是必要的,因为一个词直接在词类标签后)并按下OK.     WordSmith检查角括弧内是否是文字或标注始标记:           在这里,我们选"No".再次按下OK.       你看到的介词和标注(但没有任何其他标记).    4.Wordlist4.1词表WordSmithTools的词表像这样的:       这表明每个单词在文本文件了出现的频率,其在文本词汇中所占比例,以及每个单词在多少的文本文件中出现.4.2制作单词列表要制作单词列表,先按WordList按钮,在主控制器(​http:​/​​/​www.lexically.net​/​wordsmith​/​step_by_step_chinese​/​introduction.htm​).              WordList启动后,选择文本然后你会看到这样的.           在这里,我们要作出一个基于8文本文件简单的词列表,文本来自戏剧RomeoandJuliet,按 Makeawordlistnow.           WordListtool显示一个频率列表.最常用的词是"#".有985个#.怎么回事?原来,#在默认情况下被用来代表任何数字,如65,40 或 $997.82. 在#下,最常见的词是 the,and,Ito,of.旁边,你可以看到它在我们使用的8文本里的频率,每个词的百分比,以及每个词在8个文本中出现的次数.好像 I 的频率最高,但在8个文本中却没有出现.     要按字母顺序排列看词,请按一下窗口底部附近的alphabetical标签.           现在,向下滚动到 wherefore.结果似乎证实了我们做concordance的发现.     4.3Concordancing选定词一旦你在屏幕上得到了一个词表,您可能希望看到一些词所在的语境.     选择一个字(或多个)          并选择计算|Concordance.     您会得到像这样(如果制作词表时的原始文本仍在原位):     4.4lemmatising要手动进行lemmatise,用屏幕上的单词列表, 把它拖到您想加入到的线上. 再放开: 你会看到总数的变化并且Lemmas栏中的项目为可见. 如果有很多,您可以双击Lemmas栏看到详细资料: 4.5词表统计4.6多词单元用二或三个词(n-grams)制作词表,如OFTHEINTHEENDONCEUPONATIME等等,你先要计算一个索引文件.这主要是表明每一个单独的词在您的语料库的位置.制作一个多词词表,你得到像这样的结果. 按Ctrl/F2保存它,提示的文件名类似于 _index_3-5-wordclusters.在以后可以作为一个普通的词表打开它.5.KeyWordsWordSmithTools的关键词列表像这样的.           该关键词是与某种参考语料比较,其出现频率很高的词.关键词旁边有不同的数字,告诉您每一个词在源文本的频率,以及与参考语料相比的频率.在上述列表中,与英国国家语料库相比,戏剧RomeoandJuliet的8个文本有许多主要人物的名字,和一些古语词,如 thou、thee、和love.     要制作关键词列表,首先按KeyWords按钮,在主控制器(​http:​/​​/​www.lexically.net​/​wordsmith​/​step_by_step_chinese​/​introduction.htm​).         当KeyWords启动后,选菜单上的 File,再选 New,你会看到这样的.           你必须选择由WordSmith工具制作并保存的单词列表.     你可以按这个按钮选择单词列表文件:              如果您已经选择了一个以上的单词列表和另一个如下的参考列表,按Makeakeywordlistnow.(您选择后,该按钮才能启用.)你会看到像这样:                  这是一个关键词图示,文本来自于BritishNationalCorpus(BNC)的a1f,与整个的BNC做比较.           你看到:    •每个关键词(KW)(这些显然都与国际关系有关)衡量其发布及其关键度•相同的文本里每个关键词在与其他关键词有多少联系•每个关键词在文本多少次(点击).•地图显示了在每个单词的来源.在左边的蓝线代表文本的开始,在右边的蓝线代表了结束.看看 Britain,Germany,Italy 和 century --这些在文本的四分之三之处好像突然增多. China,Mao,Peking 在文本稍后部分同现.     一旦你在屏幕上得到了一个关键词表,您可能希望看到的一些词所在的语境.选择一个字(或多个)         并选择 计算|Concordance.在这里,神秘的HAH 已被选定.     您会得到像这样(如果制作词表时的原始文本仍在原位):          PAGE/NUMPAGES
本文档为【(精心整理)WordSmith使用介绍】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
夕夕资料
拥有专业强大的教研实力和完善的师资团队,专注为用户提供合同简历、论文写作、PPT设计、计划书、策划案、各类模板等,同时素材和资料部分来自网络,仅供参考.
格式:doc
大小:706KB
软件:Word
页数:0
分类:互联网
上传时间:2021-03-29
浏览量:86