本书面向自然语言理解的需要,以框架语义理论为基础,从资源建设、自动标注到应用技术,对汉语框架语义网的相关工作进行探索和实践。介绍汉语框架语义资源建设工作,包括框架语义理论、框架语义词典和语料库的构建以及该知识库的语义Web语言表示体系等;通过大量语料分析和统计,分析汉语语言的规则形式和特点;展示汉语框架语义网本体表示、推理、集成及其应用方面的研究工作;包含汉语词元识别模块、未知框架检测模块、框架消歧模块和语义角色标注模块等技术内容。
样章试读
目录
- 目录
前言
第1章 框架语义学及汉语框架语义网1
1.1 框架语义学简介1
1.1.1 基于框架的语义理解1
1.1.2 框架元素的句法实现方式4
1.1.3 框架语义学和其他语义学的关系7
1.2 框架语义网8
1.2.1 框架语义网概述8
1.2.2 FrameNet的内容11
1.2.3 FrameNet的特色16
1.2.4 FrameNet的应用价值17
1.3 汉语框架语义网构建路线17
1.3.1 自底向上的构建路线17
1.3.2 语料库建设19
参考文献19
第2章 汉语框架语义网框架库的构建21
2.1 认知领域框架21
2.1.1 认知领域的界定及词语采集21
2.1.2 汉语认知领域框架示例22
2.1.3 认知领域框架-框架关系32
2.1.4 认知领域框架解析34
2.1.5 认知领域框架元素解析36
2.2 位移领域框架举例38
2.3 名物类框架举例40
2.4 修饰性框架举例42
参考文献43
第3章 汉语框架语义网例句标注规范44
3.1 标注范围44
3.1.1 目标词tgt和框架元素标注44
3.1.2 几类不用标注的情况47
3.2 支撑词标注48
3.2.1 标注范围48
3.2.2 动词目标词的支撑词48
3.2.3 名词目标词的支撑词50
3.2.4 形容词目标词的支撑词50
3.2.5 支撑词标记标注时应注意的问题51
3.3 透明成分标记51
3.4 框架元素的几种特殊标记52
3.4.1 零形式框架元素52
3.4.2 框架元素融合53
3.4.3 框架元素分裂53
3.5 句法功能标注体系53
3.5.1 主语的标注规则55
3.5.2 宾语的标注规则56
3.5.3 外部论元的分析与标注规则57
3.5.4 定语的标注规则59
3.5.5 状语的标注规则59
3.5.6 补语的标注规则59
3.5.7 中心语的标注规则60
3.5.8 兼语与兼语补语的标注规则60
3.5.9 连谓结构的标注规则60
3.5.10 插入语和被插入语的标注规则62
参考文献63
第4章 汉语框架语义网词元库的构建64
4.1 汉语框架语义网的词元64
4.1.1 名词词元64
4.1.2 动词词元65
4.1.3 形容词词元68
4.2 多义词与框架的对应关系68
4.3 词元的标注报告72
第5章 汉语阅读理解系统的构建79
5.1 阅读理解系统研究现状79
5.2 语料库的主题分类与指称指代标注80
5.2.1 文章的筛选80
5.2.2 文献的主题分类标引81
5.2.3 指称指代关系标注82
5.3 目标词的确定和框架语义标注83
5.3.1 目标词的确定83
5.3.2 框架语义标注84
5.3.3 目标词和指称指代关系标注举例85
5.4 编写篇章问句和标注问句答案87
5.5 知识获取和知识库构建方法90
5.5.1 阅读理解技术对语料库的需求分析90
5.5.2 篇章标注91
5.5.3 语义知识库的构建91
5.6 阅读理解任务评测机制93
参考文献95
第6章 汉语短语结构分析及实例库96
6.1 复杂特征集与功能合一语法96
6.2 短语结构规则形式分析与表达97
6.2.1 短语结构规则的组成97
6.2.2 短语结构规则的整体性质98
6.2.3 短语规则的约束条件100
6.2.4 短语规则的各项属性汇总100
6.2.5 短语规则实例解析101
6.2.6 短语结构规则统计分析103
6.3 短语组合模式与实例库106
6.3.1 np短语组合模式107
6.3.2 vp短语组合模式109
6.3.3 ap短语组合模式112
6.3.4 mp短语组合模式114
6.3.5 pp短语组合模式115
6.3.6 sp短语组合模式116
6.3.7 tp短语组合模式117
6.3.8 dp短语组合模式118
参考文献119
第7章 汉语句法分析及实例库120
7.1 事件描述单元120
7.1.1 事件描述单元的定义和特征120
7.1.2 事件描述单元的句法结构统计121
7.2 单句型短语的组合模式及实例库124
7.2.1 由体词性成分做谓语124
7.2.2 由形容词性成分做谓语125
7.2.3 由动词性成分做谓语126
7.2.4 由单句型短语做谓语127
7.3 单句的组合模式及实例库128
7.4 复句型短语的组合模式及实例库129
7.5 语料库中复句的统计与分析132
7.5.1 语料库中复句的统计132
7.5.2 复句关系举例133
7.6 语料库中出现的几类句法类型及其标注135
7.6.1 整句135
7.6.2 直接引语136
7.6.3 独立成分136
7.6.4 句群136
参考文献137
第8章 汉语框架语义网本体和语义网标记语言138
8.1 本体138
8.1.1 本体定义及其要素138
8.1.2 本体的类型139
8.1.3 语言学本体141
8.1.4 领域本体的作用141
8.1.5 构建本体的准则142
8.2 语义Web标记语言142
8.2.1 语义Web标记语言概述142
8.2.2 可扩展标记语言144
8.2.3 资源描述框架语言147
8.2.4 语义网描述语言OWL153
8.3 汉语框架语义网本体语义Web表示方法159
8.3.1 框架库语义Web表示159
8.3.2 词元库的语义Web表示161
8.3.3 句子库的语义Web表示162
8.4 本体开发环境与工具162
8.4.1 Java语言162
8.4.2 Jena工具包165
8.4.3 JavaScript脚本语言166
8.4.4 本体构建工具Protégé167
参考文献168
第9章 旅游领域本体语言查询技术169
9.1 旅游领域本体知识库的构建169
9.1.1 基于《中国分类主题词表》的旅游领域知识描述169
9.1.2 旅游语料收集171
9.1.3 山西旅游本体库构建172
9.2 中文问句的句法与语义分析176
9.2.1 问句的句法分析176
9.2.2 问句的语义解析和语义扩展179
9.3 中文问答系统答案库构建182
9.3.1 问句与答案句的内在联系182
9.3.2 句式转换184
9.4 中文问答句形式化描述185
9.4.1 语义网查询语言(OWL-QL)185
9.4.2 中文问答句形式化描述举例187
9.5 复杂问题分解的本体汉语框架语义网189
9.6 基于本体的语义网检索模型191
9.6.1 基于语义网的语义检索模型191
9.6.2 模型实现的关键技术194
参考文献197
第10章 汉语框架语义网自动识别技术199
10.1 汉语框架语义分析模型199
10.2 目标词识别技术202
10.2.1 未登录目标词识别流程202
10.2.2 未登录目标词识别理论依据203
10.2.3 最大熵模型特征模板设计204
10.2.4 实验结果与分析206
10.3 汉语框架歧义消解209
10.3.1 框架歧义消解研究现状209
10.3.2 最大熵模型在框架识别中的应用210
10.3.3 汉语框架消歧模型的实验211
10.3.4 实验结果与分析213
10.4 汉语的语义角色自动标注216
10.4.1 汉语的语义角色自动标注现状216
10.4.2 汉语框架语义角色标注任务描述217
10.4.3 条件随机场模型标注218
10.4.4 实验语料处理方案222
10.5 汉语框架语义依存图分析226
参考文献228
附录1 汉语框架语义网框架汇总表231
附录2 通用非核心框架元素241
附录3 语料库汉语词类标记集244
索引247
后记251