句法分析是自然语言处理领域的一个关键问题,如能将其有效解决,一方面,可对相应树库构建体系的正确性和完善性进行验证;另一方面,也可直接服务于各种上层应用,比如搜索引擎用户日志分析和关键词识别,比如信息抽取、自动问答、机器翻译等其他自然语言处理相关的任务。
短语结构和依存结构是目前句法分析中研究最广泛的两类文法体系。这里先大概介绍下依存结构。
依存文法最早由法国语言学家L.Tesniere在其著作《结构句法基础》(1959年)中提出,对语言学的发展产生了深远的影响,特别是在计算语言学界备受推崇。 依存语法通过分析语言单位内成分之间的依存关系揭示其句法结构,主张句子中核心动词是支配其它成分的中心成分,而它本身却不受其它任何成分的支配,所有受支配成分都以某种依存关系从属于支配者。 在20世纪70年代,Robinson提出依存语法中关于依存关系的四条公理,在处理中文信息的研究中,中国学者提出了依存关系的第五条公理,如下:1、一个句子中只有一个成分是独立的; 2、其它成分直接依存于某一成分; 3、任何一个成分都不能依存与两个或两个以上的成分; 4、如果A成分直接依存于B成分,而C成分在句中位于A和B之间,那么C或者直接依存于B,或者直接依存于A和B之间的某一成分; 5、中心成分左右两面的其它成分相互不发生关系。
句子成分间相互支配与被支配、依存与被依存的现象普遍存在于汉语的词汇(合成语)、短语、单句、复合直到句群的各级能够独立运用的语言单位之中,这一特点为 依存关系的普遍性,依存句法分析可以反映出句子各成分之间的语义修饰关系,它可以获得长距离的搭配信息,并与句子成分的物理位置无关。 附:LTP依存分析模块所使用的依存关系标记含义 (http://www.ltp-cloud.com/demo/)
现在的依存句法分析标注关系 (共14种) 及含义如下:
关系类型TagDescriptionExample
主谓关系
SBV
subject-verb
我送她一束花 (我 <-- 送)
动宾关系
VOB
直接宾语,verb-object
我送她一束花 (送 --> 花)
间宾关系
IOB
间接宾语,indirect-object
我送她一束花 (送 --> 她)
前置宾语
FOB
前置宾语,fronting-object
他什么书都读 (书 <-- 读)
兼语
DBL
double
他请我吃饭 (请 --> 我)
定中关系
ATT
attribute
红苹果 (红 <-- 苹果)
状中结构
ADV
adverbial
非常美丽 (非常 <-- 美丽)
动补结构
CMP
complement
做完了作业 (做 --> 完)
并列关系
COO
coordinate
大山和大海 (大山 --> 大海)
介宾关系
POB
preposition-object
在贸易区内 (在 --> 内)
左附加关系
LAD
left adjunct
大山和大海 (和 <-- 大海)
右附加关系
RAD
right adjunct
孩子们 (孩子 --> 们)
独立结构
IS
independent structure
两个单句在结构上彼此独立
核心关系
HED
head
指整个句子的核心
以前比较复杂的依存关系标记含义版本:
依存关系标记(共24个)定中关系ATT(attribute) 数量关系QUN(quantity) 并列关系COO(coordinate) 同位关系APP(appositive) 前附加关系LAD(left adjunct) 后附加关系RAD(right adjunct) 动宾关系VOB(verb-object) 介宾关系POB(preposition-object) 主谓关系SBV(subject-verb) 比拟关系SIM(similarity) 核心HED(head) 连动结构VV(verb-verb) 关联结构CNJ(conjunctive) 语态结构MT(mood-tense) 独立结构IS(independent structure) 状中结构ADV(adverbial) 动补结构CMP(complement) “的”字结构DE “地”字结构DI “得”字结构DEI “把”字结构BA “被”字结构BEI 独立分句IC(independent clause) 依存分句DC(dependent clause)
参考链接
转载于:https://www.cnblogs.com/CheeseZH/p/4682166.html
相关资源:数据结构—成绩单生成器