首页 机器人大作业

机器人大作业

举报
开通vip

机器人大作业机器人大作业 语音系统在机器人中的应用 07机电2班 组员:吴斯栋、李敏裕 马李、林荣毅 (一)语音系统的进展概况 语音合成与识别技术是智能机器人领域的一个重要研究方向,也是智能机器人的一项关键技术。多年来国际国内都有大量的科技工作者致力于这方面的研究开发工作,因而对许多问题的认识与求解都取得了长足的发展。 机器人“robot”一词起源于捷克语,意为强迫劳动力或奴隶。1921年,捷克剧作家KarlCapeek在剧本《Rossum,SUnivesralRobots》中,描述了一个具有人的外表,特征和功能...

机器人大作业
机器人大作业 语音系统在机器人中的应用 07机电2班 组员:吴斯栋、李敏裕 马李、林荣毅 (一)语音系统的进展概况 语音合成与识别技术是智能机器人领域的一个重要研究方向,也是智能机器人的一项关键技术。多年来国际国内都有大量的科技工作者致力于这方面的研究开发工作,因而对许多问 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 的认识与求解都取得了长足的发展。 机器人“robot”一词起源于捷克语,意为强迫劳动力或奴隶。1921年,捷克剧作家KarlCapeek在剧本《Rossum,SUnivesralRobots》中,描述了一个具有人的外表,特征和功能的机器,并命名为认Robota。英语的Robot,一词就是由此演变而来的。基本上,一个机器人包括:机械设备,如可以与周围环境进行交互的车轮平台、手臂或其它构造。设备上或周围的传感器,可以感知周围环境并向设备提供有用的反馈。根据设备当前的情况处理传感输入,并按照情 况指示系统执行相应动作的系统。 语音识别和语音合成技术是一种人机语言通信技术,属于计算机智能接口技术。多媒体技术也主要是利用计算机语音处理和图象处理的能力为人们提供一种更加方便,直观的人机界面。机器人技术和语音技术的结合就成为了一项新的技术课题:智能语音机器人。人们一直以来对自由交流方式的本能渴望正是语音识别技术坚定不移的发 展动力。自从工业革命以来,各种机械化设备虽然提高了劳动生产率,创造了巨大的物质财富,但是我们在面对它们时却不得不放弃最习惯、最自然的沟通方式一一自然语言。因此,我们从来就没有放弃过这样一个梦想:让机器与人之间也能像人与人之间一样进行交流。而成就人类这种梦想的最关键技术之一就是语音识别与合成技术。 今天,随着语音识别技术已经取得了巨大的进展。一些智能语音机器人技术已经开始得到广泛的应用,具有语音识别功能的产品也不断出现,这些都标志着智能语音机器人技术距离人类的日常生活己经越来越近了。我国的语音识别技术研究起步并不晚,但由于各种客观条件的限制,早期的研究工作进展缓慢。上个世纪80年代中期以后,在国家怡63计划,I的积极推动和国内各科研机构的艰苦努力下发展迅速,它经历了从特定人到非特定人、从小词表到大词汇量、从孤立字到连续语音的发展历程。在汉语语音识别市场,目前居于领先地位的仍是IBM。IBM依赖于OEM和二次开发商很快占领了大部分的市场份额,已经将汉语语音识别技术应用在电信和呼叫中心之中。我国台湾声硕公司的汉语连续语音输入系统、,说亦通刀在台湾市场占据了60%的份额,并从1999年开始已逐步进入大陆市场。新技术的迅速发展也造就了一批专业化的核心技术厂商,如L&&H、oragon、SPeeehworks、Nonauee、InOfWork等等。他们凭借着手中掌握的语音识别技术也在语音市场中占据了一席之地。国外一些知名公司都推出了相应的语音识别产品。国内的语音识别研究的机构并不少,比较著名的有清华大学电子 工程 路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理 系语音识别实验室、中科院自动化所模式 识别实验室、清华大学计算机系人工智能实验室、中科院声学所等等。除了这些研究机构在国家各种科技发展计划和基金的支持,致力于语音识别技术研究的同时,也有一些公司企业在开始从事技术应用化的一些工作。但从目前来看,能够真正进入核心技术全面产品化阶段的单位并不多。 (二)语音系统在机器人中的应用 采用人工合成的声音向人们传递各种警告和信息已有很长的时间,如微波炉用声音告诉人们食品已做好;现代的机器人与人类间的语言交流等。 机器人实现语言功能一般有两种方法,一是采用现成语音芯片,把预先录制好的自然声音(可以是各种语言)录入芯片中,根据程序调用特定的地址,实现机器人的语音功能,采用这种方法的机器人只能发出有限的几句话。如果使机器人根据使用者的要求发出无限句语言,则需要采用另一种方法。该方法是通过在芯片中储存一个一个的语音音素,通过编程按一定的顺序调用这些语音音素,这些语音音素巧妙地合成一个个英文单词,实现语音功能。该方法能够实现机器人发出各种提示音,比如,HERO-I机器人便是运用声音合成器来实现其说话功能的,其中声音合成器能产生英语所需要的64个基本语音(音素),通过适当地编程将不同的语音列在一起,可使HERO-I的声音合成器模拟人的说话(英语)。 单音是语言的最小单元,把单音根据一定的规则连起来就构成语言。但是一个单音在一个单词或一个词组中的位置可以改变它的发 音。这种改变的原因是共发音,如:“pan”和“pin”中的“p”的发音是不同的,这是因为在发“p”的时候预想着在说“an”或“in”,因而为了更容易发接着的单音而修饰前一个单音的发音。由于共发音或者其它因素而被修饰的单音叫同分异构音,把单音稍微变动一下构成的新的声音叫同素异构音。把所有的具有同样功能的单音和同分异构音(如pan 和pin 中的p)及同素异构音(如“phonetics”中 的“p”发音来自“f”而不是“p”)构成音素。音素是让听者能区别一个单词和另一个单词的声音的。 电合成语言的方法有单词存储和音素存储。用单词存储只能存有限的几个,而常用的是音素存储。因为音素是语言建筑的基本元件,所以要产生语言,只要将存储在存储器内的音素按正确的次序串接在一起,然后将音素串作用到音素合成器(pss)再生出语音。这样 PSS 可用最小的存储空间合成无限的词汇。 使用音素合成器的最大困难是如何把音素串接在一起以产生一个单词。同一个字母在不同的单词中发音不同,如元音“a”在“name"中发长音,但在“father”中要发短音,可见有些字母的音素不止一个。要根据具体的发音来决定音素。任意的几个音素组合起来可构成成千上万个基本单词。 音素串是使合成器发出正确单词的基本条件,确定音素串时要识别单词中包含声音的数和型。在一个 英语单词 七年级上册英语单词表高考英语单词3500记忆高中3500个英语单词表七年级下册英语单词表小学六年级英语单词表 中,有至少1 个元音或1个元音和几个辅音的组合。写音素串时首先大声并小心地读这个单词,留意在声音之间的停顿、长短和休止,然后再用音素转换表中合 适的符号来识别出每个声音的搭配。在构成音素串时,在单词的首位加上休止或空格是非常有必要的,这个休止(无声音)是用来简单地保证在音素串中的多个单词不要碰在一起。无声音“PAO”是47ms的时间延续,“PAI”是185ms的较长的时间延续。如果希望要更长的时间,可简单地重复这2个音素符号之一。 大多数微处理器不能直接识别音素符号,一般是采用将 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 的音素符号翻译成微处理器输入/ 输出(I/O)代码的方法(即十六进制音素代码)。如“Hello”的十六进制音素代码为“3E 1B 3B 18 35 37 3E”,这7个代码输入计算机后机器人就会发出“Hello”的声音。 如果只是使用标准音素来编写“hello”的程序,写成“PAI H EH L OI IU PAI”,合成器可以正常地工作的,但这个声音是非常单调刻板的。音素合成器可以用指令来改变任何单调的声音,也可以把一个基本句子的意义转换而产生叙述句、感叹句或问句。 HERO-I 机器人对每个音素有4个音调水平,用数字0-3来表示,0 是对于任何音素符的,不作注明。人们可用软件来直接输入4个音调的升降水平。在代码上通过简单的加40,80,C0可分别使音调提高1级、2级、3级。 在HERO-I机器人中,使用了一个单片语音合成器SC-01,它可提供串接音素的最佳声音质量。 SC-01语音合成芯片的技术指标为: (1)电源电压:Vp=7-14V (2)时序源:可以用SC-01内部的时序发生器工作,也可用一个外部 的时钟频率,在片内最佳配选的时钟频率为720kHz。改变这个时钟频率,就会改变输出语言的频率和音素时序。但一般用直接变调(或音高)控制输入线,而不用改变音素时序来改变音素的频率。 (3)控制信号:选通信号(STB),由微处理器提供,并将允许/请求(A/R)信号清0。产生于SC-01 的允许/请求信号用于通知微处理器关于SC-01的状态,当选通信号允许新的音素数据进入片中,A/R信号清0从而禁止微处理器输出下一个选通状态。在SC-01有足够的时间找寻音素后,A/R信号复位。这时微处理器向SC-01发出一个新的选通信号。这样,A/R 信号在微处理器和音素合成器间提供必要的交换。音高(音调)水平输入线(I1和I2)改变SC-01的输出音调高低,SC-01 共有4种音调,I1I2=0 时最低,I1I2=1时最高。 (4)音素代码:由微处理器产生的音素数据以6位并行输入SC-01,实际上SC-01可以响应8位数据代码,剩下的( 位用来控制被选择的音高或音调水平。6位二进制音素代码决定要产生合成器的64个不同音 素的哪一个音素。 (5)输出放大:SC-01内部备有音频前置放大器,但还不能直接驱动扬声器工作,必须提供一个外部声频放大器。如果想得到尽可能自然的语音,放大器应具有低通滤波的特性,以减少在发摩擦音时的较高谐波。 利用语音合成器产生的64个语音音素,加之巧妙的编程,可以让机器人按照设计者的意图讲话。同时还可附加许多功能,如报时、导游、导盲、外界声光环境提示等,进一步体现了HERO-I机器人的智能 化技术。 (三)目前各大公司及大学的典型语音产品 2010上海世博会离我们越来越近,作为各国展示自己科技成果的重要平台,各国纷纷将代表自己最高科技水平的产品在世博会上加以展示。近期科大讯飞和浙大中控携手合作,推出了能听会说的世博机器人。由上海世博局创意,浙江大学和中控研究院研发制作了以世博会吉祥物“海宝”为原型的智能机器人,科大讯飞在“海宝”机器人中加入了语音交互功能,使世博会吉祥物“海宝”可以实现“能听会说”。“海宝”机器人将会向游客提供各种世博会信息咨询,还能与大家通过语音互动交流,将成为上海世博会的一大亮点。 智能机器人技术和语音交互技术均为国家“863”计划重点支持的方向,本次“海宝”机器人中使用语音技术均由国际领先的语音厂商科大讯飞提供。通过语音识别,海宝可以听懂游客说的话。 讯飞语音识别技术能提供准确的端点 检测 工程第三方检测合同工程防雷检测合同植筋拉拔检测方案传感器技术课后答案检测机构通用要求培训 、智能打断、多语义识别及自由说功能,基于该技术浙江大学与中控研究院还设计了精准的开放式人机对话,实现灵活的语音交互,使机器人能够准确识别各种声音指令。如,你对海宝说:“给我拍张照片吧”,它会提醒你说“茄子”;如果你要和它合影,它还会摆出各种姿势。海宝中同时还集成了科大讯飞领先的语音合成技术,使得海宝能以不同语气语调、使用富有感染力的语音说出任何想说的话。2010年5月,神奇的海宝出现在上海浦东、虹桥机场及世博会主要场馆,为世界各地的游客提供优质的“向导”服务。 在日本东京购物,人们往往为了买一张新的视频游戏碟或一部手机排队等几天。新开张的百货商场经常被挤得水泄不通,里面很多中年妇女抢购打折的陶器和洗衣机。为了缓解东京商场的混乱局面,使顾客更容易买到东西,高岛屋商场决定引入语音识别机器人当店员,试用一个星期。这款语音识别机器人名叫萨娅,是由日本东京理科大学的小林宽司(音译)于2004年研制的。前一段时间,萨娅在东京一小学从事教学工作。该机器人代课老师能够吸引学生的注意力,督促学生做课堂笔记,学生做错了事,还会对他们进行严厉的批评。最近,萨娅开始在银座街的高岛屋商店“工作”。萨娅能够用超过700种不同的方式,对购物者的问题和投诉做出反应,它会告诉顾客去哪层楼能够买到他们所需的商品,还能和他们闲聊几句,但有时也会无法“沟通”,曾有一位记者问萨娅问题,可能是因为他口音太重,萨娅“听”不懂,一直指着洗手间的方向,无法告诉记者所要去的商场楼层。虽然它的面部动作也还存在一些不足,但表现高兴、伤心或生气时还是很逼真的。另外,程序设计师在它身上安装了反应器,萨娅可以回答别人关于它“身世”的问题。尽管萨娅是一个机器人,但它像其他日本人那样讲礼貌,行鞠躬礼。很快,萨娅将回到东京大学从事内勤工作。
本文档为【机器人大作业】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
is_614050
暂无简介~
格式:doc
大小:20KB
软件:Word
页数:7
分类:生活休闲
上传时间:2018-03-31
浏览量:118