首页 自然语言理解-语义知识的形式化表示

自然语言理解-语义知识的形式化表示

举报
开通vip

自然语言理解-语义知识的形式化表示语义知识的形式化表示什么是意义?关于意义的许多说法指称论意念论行为论情境论实证论真值论用法论境况论……从计算机的角度看意义计算机只能在符号世界里转圈圈;意义就是符号变换的游戏;纯粹从符号世界的角度看,“A的意义是B”意味着什么?所谓知道一个符号串的意义,包含两层意思:1你可以把一个符号串A变换为符号串B;2原则上,关于这个符号串A的变换游戏没有止尽;意义:符号之间的变换关系a.在一种语言内进行的符号变换“张三打了李四”“李四被张三打了”b.在不同语言之间进行的符号变换“张三用手打了李四”“ZhangSanhitLi...

自然语言理解-语义知识的形式化表示
语义知识的形式化 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示什么是意义?关于意义的许多说法指称论意念论行为论情境论实证论真值论用法论境况论……从计算机的角度看意义计算机只能在符号世界里转圈圈;意义就是符号变换的游戏;纯粹从符号世界的角度看,“A的意义是B”意味着什么?所谓知道一个符号串的意义,包含两层意思:1你可以把一个符号串A变换为符号串B;2原则上,关于这个符号串A的变换游戏没有止尽;意义:符号之间的变换关系a.在一种语言内进行的符号变换“张三打了李四”“李四被张三打了”b.在不同语言之间进行的符号变换“张三用手打了李四”“ZhangSanhitLiSiwithhishand”c.在不同性质的符号系统之间进行的符号变换“这是残疾人通道”意义:符号之间无止尽的变换关系“我买了辆车”意思1:我付钱从某处购买了一辆车意思2:我拥有了一辆车意思3:我可以使用这辆车意思4:我的钱都花完了……如何确定符号之间的变换关系问题1:如何让计算机知道“A的意思是B”?问题2:如何让计算机把符号A变换为符号B?问题1=问题2困难:形式与意义的非一一对应性一个形式——多个意义自然语言理解必须面对的问题一个意义——多个形式“意义”怎么能论“个”呢?自然语言生成必须面对的问题把上述问题换种表述法:符号A对应着多个可能的变换结果B1,B2,B3,…,在特定场合下,到底选哪一个?一个形式——多个意义(多义词)这个编辑很不错他每年要编辑一百万字的书兼名、动两个词性的多义词这小伙子是干警察的好材料把这个小伙子的材料送人事部这是一种新型材料只有名词一个词性的多义情形这是我刚买的字典我刚查的字典,难道还有错虚词的多义情形一个形式——多个意义(多义词?多义句式?)许多读者给编辑部打来了电话X1+有+Y1:空间关系这本书有许多读者X2+有+Y2:领有关系编辑部有许多读者张老大有很多手下许多人给编辑部打来了电话读者1:0价*这本书有许多人读者2:1价编辑部有许多人手下:0/1价?张老大有很多人一个形式——多个意义(指代消解)张三i把他j出卖了张三i把他i,j的朋友出卖了老张i有个漂亮的女儿j,φi,j很骄傲老张i买了辆新车j,φj很贵老张i中了头奖j,φi很高兴一个形式——多个意义(泛指与特指)人是会死的苏格拉底是人苏格拉底是会死的鲁迅的作品不可能在一天之内全部读完《祝福》是鲁迅的作品《祝福》不可能在一天之内全部读完一个形式——多个意义(量化词组)驴子句(donkeysentence)IfJohnownsadonkey,hebeatsit.Everyfarmerwhoownsadonkeybeatsit.Johnownsadonkey.一个形式——多个意义(结构、关系)发现了敌人的哨兵牛奶饼干反对的是他他正在上课开刀的是张大夫在火车上写标语小明的信一个形式——多个意义(隐喻)董永这回算是背上口大黒锅了这家伙真是个狐狸白天不懂夜的黒送温暖办教育董永终于抹平了七仙女心头的创伤教堂的钟又敲响了卧室的钟慢了整整一个小时一个意义——多个形式(同义词)不——没(有)我不去西藏——我没去西藏我不知道结果——*我没知道结果*我不病——我没病这锅肉还不烂——这锅肉还没烂一个意义——多个形式(同义结构)A马文才害死了梁山伯——B1梁山伯被马文才害死了B2马文才把梁山伯害死了1)AB2*B1,又抢走了祝英台。2)*A*B2B1之后,一家人整日以泪洗面。语义知识的性质和作用语义知识跟句法知识的性质差别主要在于知识颗粒度的粗细不同——语义知识就是细化了的句法知识;句法知识就是非常概括的语义知识;宏观而言,语义知识跟句法知识的作用是相同的——都是为了正确地进行符号串的变换操作依赖语义知识进行结构分析例1发现宝藏的人v+n1+的+n2例2知道敌军的意图v+n1+的+n2依赖语义知识进行词义消歧多义词义项释义英语译词例1想主意想1思索,思考think例2想女儿想2想念,怀念miss依赖语义知识进行推理例1乡长买了一瓶茅台->乡长拥有了一瓶茅台例2乡长给了村长一瓶茅台->村长得到了一瓶茅台->乡长失去了一瓶茅台例3乡长正在打鼾->乡长正在睡觉例4Everyfarmerwhoownsadonkeybeatsit.Johnisafarmer.Pandoraisadonkey.DoesJohnbeatPandora?--Yes.--Idon’tknow语义·理解·语义知识理解符号串A的意思=将A变换为符号串B对A进行句法结构分析在机器看来,只不过是在做符号串变换的操作对A进行词义排歧分析对A进行推理……要进行上述符号变换操作,除了需要句法知识外,还需要语义知识语义知识的类型及其形式化表示关于词义聚类关系的知识(纵向)关于词义组合关系的知识(横向)[属性名:属性值]型语义知识(静态)-词典[条件->动作]型语义知识(动态)-规则句法知识与语义知识的一体化(同样的形式化表示)关于词义聚类关系的知识同义(近义)关系反义关系同位关系上、下位关系语义特征表示语义场描述语义场是对语义特征的系统化表述顺序,循环,层级,…语义场为结构化的语义特征值提供了描述手段一月,二月,……,十二月星期一,星期二,……,星期日钱,两,斤,公斤,吨学士,硕士,博士国,省,市,县,镇,乡,村语义场描述颜色语义场Xvpnp::$.内部结构=述宾,IF%vp.受事=%npTRUE,IF%vp.结果=%npTRUE,…{R2}np->vpu<的>np::…,IF%vp.内部结构=述宾THEN%vp.施事=%npENDIF,…发现宝藏的人——[[发现宝藏]的人]知道敌军的意图——[知道[敌军的意图]]发现敌人的哨兵——[发现[敌人的哨兵]]——[[发现敌人]的哨兵]广义配价模式纵向拓展从词到短语在两个方向上对 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 配价模式进行扩展横向拓展从“动——名”关系拓展到“动——形”关系,“形——名”关系,“名——名”关系,“副——形”关系,……短语结构的组配性质买——买衣服买贵了——这件衣服你买贵了*你买贵了这件衣服晾——晾衣服晾阳台上晾干——晾干衣服*晾干阳台上“动-形”语义组配描述买便宜的布*买便宜染红洗干净了洗胖了洗聪明了*洗僻静了*洗适宜了*洗远了?洗浓了动词形容词动词形容词名词其他词类之间的组配约束名——名组配(n+n)整体-部分关系“没有盖儿的杯子”-“没有杯子盖儿”集合-成员关系“北大的学生”-*“学生的北大”实体-材料关系“塑料凉鞋”-*“凉鞋塑料”个体-亲属关系“老张的女儿”-*“老张的”副词/形容词——动词(短语)*正在知道…*马上买贵了*认真地懂得了………格语法CaseGrammarCharlesJ.Fillmore,1966TowardsamodernTheoryofcaseThecaseforcase格辨SomeProblemsforCaseGrammar格的含义传统语言学中的格是表层格词尾变化词干音变格语法中的格是“深层格”体词与谓词的及物性关系句法语义关系例子Thedooropened.Thekeyopenedthedoor.Theboyopenedthedoor.Thedoorwasopenedbytheboy.Theboyopenedthedoorwithakey.Theboy:施事格Thedoor:客体格Thekey:工具格格语法基本规则词汇部分转换部分基本规则S->M+PP->V+C1+C2+…+CnC->K+NP基本规则S->M+P一个句子S可以改写成情态和命题两大部分情态部分包括否定、时、式、体、以及其他被理解为全局情态成分的状语命题牵涉到动词和名词短语、动词和内嵌小句之间的关系基本规则P->V+C1+C2+…+Cn任何命题P都可改写成一个动词V和若干个格C。动词是广义上的动词,包括:动词、形容词、甚至包括名词、副词和连词基本规则C->K+NPK为格标,是各格范畴在底层结构中的标志。格表施事格Agentive工具格Instrumental承受格Dative使成格Factitive方位格Locative客体格Objective收益格Benefactive源点格Source终点格Goal伴随格Comitative词汇部分在词库中标明词汇的底层格的特征Street[+Locative]Idea[-Locative]标出动词的框架特征Cry[+A]run[+A]Cry和run可以带有一个表示施事的NP区分必选格和可选格转换部分和转换语法类似移动删除插入复写格语法与汉语有局限性汉语不是动词中心流水句、无动局、连动、紧缩等结构,无法用一个动词统率一个句子的模式来描述。义素分析法丹麦语言学家叶姆斯列夫L.Hjelmslev美国语言学家卡茨J.Katz和福多尔J.A.Fodor提出解释语义学义素分析法义素是意义的基本要素义素是词的理性意义的区别特征词的理性意义是一系列语义特征的总和例1男人:[+人]、[+成年]、[+男性]女人:[+人]、[+成年]、[-男性]男孩:[+人]、[-成年]、[+男性]女孩:[+人]、[-成年]、[-男性]例2陆军:[军队]{[在陆地][作战]}f{[通常由……组成][步兵][炮兵][装甲兵][ 工程 路基工程安全技术交底工程项目施工成本控制工程量增项单年度零星工程技术标正投影法基本原理 兵]各[专业部队]海军:[军队]{[在海上][作战]}f{[通常由……组成][水面舰艇][潜艇][海军航空兵][海军陆战队]各[专业部队]同一类型的义素写在同一花括弧f:适用范围“各”是一个标志,它表示被标志的义素可以分解为若干同类的义素。义素分析法了解词与词搭配是在语义上受到什么样的限制用于判断同义词、近义词之间的差别蒙太古语法MontagueGrammar语义研究的形式化问题蒙太古认为自然语言研究必须是数学的一个分支组成部分句法翻译语义MG理论模式词库有意义的词语义类内涵逻辑表达式语义规则特定模型中的外延或内涵所指对应函数f翻译规则基本词语语类句法规则树形图MG句法部分语类categorye和t以及它们之间关系的一组集合e:表示个体词语(individualexpression)或实体词语(entityexpression)不同于名词或者名词短语e.g.chair不属于e语类,只有具体的某把椅子的词语才属于e语类t:表示具有真值的语言单位,真值词语(truthvalueexpression)或陈述语句(declarativesentence)语类如果A和B位语类标记,则A/B、A//B均为语类标记所有语类都是从e和t中推出A/B表示一个可以与B语类词语结合而产生A语类标记的语类A/B和A//B表示属于不同句法范畴而具有相同语义范畴的语类语类一览表Tryto,wishtoIV//IVBelievethat,assertthatIV/tIn,aboutIAV/TNecessarilyt/tMan,fish,friend,price,temperaturet//eCNRapidly,slowly,voluntarilyIV/IVIAVFind,lose,eat,love,be,seek,conceiveIV/TTVJohn,Mary,he0,he1,he2,…t/IVTRun,walk,talk,rise,changet/eIV无(基本词语)e无(基本语类)t基本词语定义语类句法规则句子依照费雷格原理,通过短语有小到大的结合而逐渐产生短语之间的结合通过句法规则来实现典型的句法规则Sn如果α∈PA,β∈PB,那么Fm(α,β)∈PC,且Fm(α,β)=…基本规则S1对于任何A语类来说,BA(即A类基本词语)PA(即A类短语)S3如果ζ∈PCN,σ∈Pt,那么F3,n(ζ,σ)∈PCN,且F3,n(ζ,σ)=ζs.t.σ’,其中σ’来自σ,并根据ζ中第一个BCN的{阳、阴、中}性,用{he、she、it}或{him、her、it}来提换σ中的每一个hen或himn。S2如果τ∈PCN,那么F0(τ),F1(τ),F2(τ)∈PT,且F0(τ)=everyτ,F1(τ)=theτ,F2(τ)=不是aτ就是anτ,具体情况依中第一词和或搭配形式而定。合取和析取规则S11和S13处理有and或or连接的合取或析取短语S11如果μ,ψ∈Pt,那么F8(μ,ψ),F9(μ,ψ)∈Pt,且F8(μ,ψ)=μandψ,F9(μ,ψ)=μorψ量化规则S14至S16为量化规则S14α∈PT,β∈PT,那么F10(α,β)∈PT,且:如果α不是hek形式短语(即不是传统意义上的人称代词),那么F10(α,β)就等于将β中第一个hen或himn用α代替,其后出现的hen或himn则根据α中第一个BCN或BT的性用{he,she,it}或{him,her,it}替换如果α=hek,则F10(α,β)等于将β中所有的hen或himn用hek或himk来替换时态及记号规则S17为时态及记号规则MG翻译部分MG为表示句法和语义的同态性,通常将句子翻译成内涵逻辑表达式每一条句法规则都有相对应的一条翻译规则MG翻译部分∧δ’表示δ’的内涵,∨δ’表示δ’的外延P{a}=∨P(a)叫做括号等式∨∧δ’=δ’谓词变项P表示个体集合的属性人名和代词在MG中的依法分别为:λP[P{α}],λP[P{hen}]λ变换λ变换指的是把主目代入含有λ算子指定的那个变项的表达式中,并消掉λ及变项。λx[…x…](a)=[…a…]函数应用规则S4至S10将A/B语类的短语与B语类的短语结合而产生A语类的短语S4如果α∈Pt/IV,δ∈PIV,那么F4(α,δ)∈Pt,且F4(α,δ)=αδ’,其中δ’是将δ中的第一个动词替换成第三人称单数形式的结果。MG语义部分MG内涵逻辑有句法和语义两部分组成句法部分主要确定内涵逻辑表达式义类问题语义部分主要有语义规则组成,这些规则根据模型来确定内涵逻辑表达式中的所指问题。MG内涵逻辑句法部分内涵逻辑的句法主要确定内涵逻辑表达式的逻辑义类(logicaltype)问题基本义类有两个:e和te表示个体t表示真值义类和语类是不同的概念义类的递归性的定义t是一个义类;e是一个义类;如果a和b是义类,那么是一个义类;如果a是义类,则是一个义类其中表示一个由a向b映射的函数,表示a的内涵。义类与语类的对应关系义类与语类一一对应,有一个函数关系,用f表示f(t)=tf(e)=e对于任何A、B语类来说,f(A/B)=f(A//B)=<,f(A)>MG内涵逻辑句法基本成分常项变项内涵逻辑句法部分的作用主要是确定内涵逻辑表达式的义类,其规则表述如下:α义类中的每一个变项都属于MEα(即α义类的有意义词语);α义类中的每一个常项都属于MEα;如果α∈MEα,u为b义类变项,则λuα∈ME;如果α∈ME,β∈MEα,则α(β)∈MEb;等等MG内涵逻辑语义部分内涵逻辑模型语义规则,主要确定内涵逻辑表达式的所指问题内涵逻辑模型具体表述如下Da=ADt={0,1}D=D=其中Da表示a的所指(denotation)。E的所指为模型中的个体集合,t的所指为一个真值集合,的所指是一个由a所指向b所指映射的函数。是a的内涵内涵逻辑的语义规则如果α是一个非逻辑常项,则如果α是一个变项内涵逻辑的语义规则如果α∈MEα,μ是一个b义类变项,则是一个函数h,其定义域为Db。对于Db中任何一个x来说,其中g‘表示对变项y的一次赋值。内涵逻辑的语义规则如果α∈ME,β∈MEb,则小结:句法与语义的分界与重叠小结:语言知识的筛子模型小结:意义的组合原则(principleofcompositionality)语言中有多少成分的意义可以被“组合”出来,有多少不能被“组合”呢?组合=函数,Meaning(s)=F(Meaning(s1),Meaning(s2),…),s=s1s2…
本文档为【自然语言理解-语义知识的形式化表示】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
丹丹陪你去流浪
暂无简介~
格式:ppt
大小:618KB
软件:PowerPoint
页数:0
分类:农业
上传时间:2021-09-10
浏览量:2